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Vorwort 


Das vorliegende Buch ist der Diskursgemeinschaft der am Erlernen von 
Fremdsprachen Interessierten zugeordnet, dazu gehòren in erster Linie die 
Lehrpersonen, aber auch die Lernenden selbst, dazu die Experten aus Pidago- 
gik, Didaktik, Sprachwissenschaft, Schuldirektion und Verwaltung. 

Das Thema kann in seiner allgemeinsten Form als Frage nach dem Beitrag com- 
puterunterstützter Methoden beim Fremd- und Zweitsprachunterricht definiert 
werden. Es handelt sich um ein Thema, das seit den 80er Jahren eine Fulle von 
voreilig definierten Aufgaben und Lésungsversuchen hervorgebracht hat. Beson- 
ders auffallen muss die große Zahl hoch subventionierter Forschungsprojekte, die 
im Rahmen europäischer Fördermaßnahmen unterstützt wurden und die prak- 
tisch keinen nachweisbaren Gewinn erbracht haben. Zu diesen Momenten fehl- 
geleiteter, mit großem Enthusiasmus vorgetragener innovativer Vorschläge gehört 
auch das sogenannte Data Driven Learning (DDL), das vor 15 Jahren im Gefol- 
ge der erfolgreichen Nutzung von Korpora für lexikographische Arbeiten als All- 
heilmittel für den Sprachunterricht entdeckt und propagiert wurde. 

Im Gegensatz zu einer solchen, von einer starken Vorentscheidung zugunsten 
der von technologischen Lösungsversuchen getragenen Tradition in der Me- 
thodendiskussion, ist das Projekt „Korpus Südtirol“, das von einer Forschungs- 
gruppe EURAC-Freie Universität Bozen von 2004 bis 2007 durchgeführt 
wurde, als Versuch der kleinen Schritte zu charakterisieren. Ausgehend vom 
objektiv gegebenen Bedürfnis, die deutschen Sprachdokumente Südtirols zu 
sammeln und für die Forschung aufzubereiten, wurden schrittweise didakti- 
sche Anwendungen erprobt, die alle durch eine genaue Zielgerichtetheit auf 
spezielle Lernergruppen geprägt waren. 

Ausgangspunkt für die didaktischen Anwendungen war das generell bekannte 
Defizit an Sprachaufmerksamkeit in Südtirol, das auf die Konstellation eines 
Sprachgebrauchs im Spielfeld von Dialekt, deutscher Hochsprache und italie- 
nischer Zweitsprache zurückzuführen ist. Zu dieser Beanspruchung kommt 
nun noch das Englische als unverzichtbare Sprache der Kommunikation. 

Das Projekt, das im vorliegenden Band dokumentiert und kritisch referiert 
wird, trägt dieser außergewöhnlichen Situation von Sprachgebrauch, Sprach- 
erwerb und Sprachenlernen in Südtirol Rechnung. 


Vorwort 


Zentrales Anliegen des Projekts und des Bandes ist der ganzheitliche Zugang 
auf die Probleme des Sprachgebrauchs und des Sprachenlernens, bei dem die 
drei Schulsprachen Deutsch, Italienisch und Englisch, die auch die Arbeits- 
sprachen der Freien Universitat Bozen sind, als Einheit betrachtet und behan- 
delt werden. Die Kompetenzen, die bei der Bearbeitung des Projekts einge- 
setzt wurden, reichen von der sprachlichen Analyse der deutschen 
Gegenwartssprache bis zu didaktischen Analysen von Lernprozessen beim ge- 
steuerten Spracherwerb in der Schule und zu computertechnischen Fragestel- 
lungen zum Interface, das den Zugang zu den Daten ermöglicht. 

Diese Ausrichtung und die im Rahmen des Projekts erreichten Ergebnisse ge- 
ben dem Buch eine ganz eigene inhaltliche Bestimmung, die es von vergleich- 
baren Werken mit stärker monographischem Charakter abhebt. Es handelt 
sich um ein Werk, das in allen Phasen der darin beschriebenen Arbeiten und 
Arbeitsschritte als Ausdruck einer theoriegestützten Praxis gelten kann. 
Innovative Elemente des Bandes sind: (1) die theoretische Fundierung der 
Lernprozesse im Rahmen eines kognitiven Modells der Grundlage der 
Sprachverarbeitung (das Resonanz-Modell), das gezielt verwertbar ist als Aus- 
gangspunkt für Sprachlernprozesse mithilfe von Korpusrecherchen; (2) die in- 
novative Nutzung von Klein- und Einzelwerkkorpora für die Sprachdidaktik 
als Antwort auf bisher ungenügend beantwortete kritische Fragen zur theore- 
tischen Fundierung von korpusorientierten Sprachlernmodellen und Strategi- 
en; (3) die Anpassung bestehender Korpora an ein einheitliches, benutzer- 
freundliches Interface für Korpora in allen Schulsprachen, (4) die Entwicklung 
neuer Ansätze und computerlinguistischer Ressourcen sowie Instrumente für 
den (semi-)automatischen Vergleich sprachlicher Varietäten, wodurch auf De- 
siderate im Bereich der Sprachkontakt- und Varietätenforschung im Allge- 
meinen eingegangen sowie ein Beitrag zur Beschreibung der deutschen Spra- 
che Südtirols im Besonderen geleistet wird, (5) die Präsentation von Methoden 
und Werkzeugen zur Ermittlung und Darstellung ausgewählter sprachlicher 
Phänomene, insbesondere im Bereich der syntagmatischen Relationen. 

Das Buch ist ein Dokument für die Bemühungen um eine global verstandene 
Spracherziehung und Sprachausbildung in Südtirol, die, seit dem Konzept der 
integrierten Sprachdidaktik aus den 80er Jahren, als Desiderat für die Schule 
und die Gesellschaft anerkannt werden. 


Bozen, April 2011 
Andrea Abel, Renata Zanin 


Vom Interface zur Sprache und zum Spracherwerb 


Andrea Abel - Europàische Akademie Bozen 
Renata Zanin - Freie Universität Bozen 


Jedes Wort, das verwendet wird, hinterlässt eine Spur. Wer es verwendet, zeigt, 
dass er/sie es gelernt hat und im Moment der Verwendung erhalt das Wort die 
Chance, aufs Neue gelernt zu werden und so in dieser und vielleicht der 
nachsten Generation weiterzuleben. 

Wörter überleben in Sprachen und Sprachen überleben in Sprachgemein- 
schaften. Sprachen sterben aus — zurzeit mit dramatischer Konstanz und Ge- 
schwindigkeit —, Wörter werden durch andere ersetzt, umgeformt, werden in 
neuen Gebrauchssituationen verwendet, erhalten neue Bedeutungen, werden 
von bestimmten Menschen oder Gruppen aufgegriffen und bevorzugt benutzt, 
werden aufgezeichnet, gelöscht, vergessen. 

Sie überleben als gelebte Gegenwart, aber auch als Palimpsest, wobei Über- 
schriebenes stärker wirksam wird als der ursprüngliche Text. Waren Palimp- 
seste einst Zeichen für einen Mangel, nämlich den Mangel an wertvollem Per- 
gament, so entstehen metaphorische Palimpsest-Wörter von heute durch 
Überfluss. Es sind Wörter, die vergessen werden, weil sie in der enormen Mas- 
se an Wörtern, Sätzen und Dokumenten nicht beachtet werden, weil sie zu 
selten sind und von der Masse der anderen Wörter überdeckt werden. Und wie 
die alten überschriebenen Pergamenthandschriften mithilfe von UV-Strahlen 
und anderen, raffinierteren Techniken wieder sichtbar gemacht werden kön- 
nen, so gibt es heute Algorithmen, die auch die verstecktesten Wörter aus der 
Masse von Trillionen von Wörtern (Tokens) aus digitalisierten Büchern her- 
auszusuchen imstande sind. Ermöglicht wird eine solche Suche durch die 
N-Gram-Datenbank!, die als Teilmenge der von Google digitalisierten Bücher 
im Dezember 2010 veröffentlicht und nutzbar gemacht wurde. 

Mit diesem neuen Suchinstrument und der ständig wachsenden Datenbank 
fällt es uns leichter, uns vorzustellen, dass jedes Wort, das verwendet wird, eine 
Spur in der Geschichte der Menschheit hinterlässt. Und diese Vorstellung, 
diese Idee, war nicht nur das auslösende Moment für die Konstitution der Ar- 
beitsgruppe, die die Google-Datenbank ins Leben gerufen hat, sondern auch 
dafür, eine neue Wissenschaft aus der Taufe zu heben, „culturomics“, der so- 
gleich das Schlagwort „cultural genome“ in die Wiege gelegt wurde. Die Auf- 
gabe und das Ziel der neuen Wissenschaft: „working to enable the quantitative 


1 http://ngrams.googlelabs.com/ 
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study of human culture across societies and across centuries“ ?. Ihre Grundla- 
ge: Ein unerhört großes Archiv an gedruckten Zeugnissen aus der Geschichte 
ist digital aufbereitet und durchsuchbar gemacht worden. Die unvermeidlichen 
Einschränkungen können der Faszination der Datenmenge nichts anhaben. 
Aber die Einschränkungen sind nicht trivial: zuallererst die Einschränkung 
auf schriftliche Zeugnisse, dazu die weitere Einschränkung auf Gedrucktes, 
verbunden mit einer kontinuierlich fortschreitenden Datenerfassung — zurzeit 
sind 11% aller gedruckten Bücher digitalisiert. Dann kommt noch die speziel- 
le Aufbereitung der Daten für die Suche hinzu, die natürlich nur einen Bruch- 
teil der Gesamtdaten betreffen kann, zurzeit sind es 4%, die bevorzugt den 
Zeitraum von 1800-2000 betreffen und bevorzugt Dokumente, die mit einem 
hohen Qualitätsstandard eingescannt wurden (was Lesefehler nicht aus- 
schließt, die schon bei den ersten Suchen auffallen). Schließlich noch eine 
weitere Einschränkung: Die Suche findet nicht im Archiv der Daten mit dem 
ursprünglichen Datenformat statt, sondern in einer eigenen N-Gram-Daten- 
bank, die zurzeit nur Daten in den Sprachen Englisch (nach Amerikanisch, 
Englisch, Fiction differenziert), Chinesisch, Französisch, Spanisch, Deutsch 
und Russisch enthält. Auch liegt keine etwa nach Textsorten und Zeiträumen 
ausgewogene Datensammlung mit unterschiedlichen Filteroptionen für eine 
gezielte Suche vor. 

Trotz aller Einschränkungen: Aktuell sind in der durchsuchbaren N-Gram- 
Datenbank bereits ungefähr drei Trillionen Wörter gespeichert. Zum Ver- 
gleich: Das British National Corpus BNC’, das für lange Zeit den Standard 
von digital erforschbaren Datensammlungen bestimmte, verfügt über 100 Mil- 
lionen Wörter. Das DWDS Kernkorpus umfasst 100 Millionen Textwörter 
(Tokens)*. Das Deutsche Referenzkorpus des Institutes für Deutsche Sprache 
(IDS), das COSMAS II zugänglich macht, umfasst ca. 3,2 Mrd. Wörter’. Die 
von Google aufbereiteten drei Trillionen Wörter können von allen Menschen 
der Welt mit Zugang zum Internet durchforscht werden. Das Programm der 
Forschungsgruppe an der Harvard Universität, das in Zusammenarbeit mit 
Google entsteht, wendet sich expressis verbis sogar an Kinder, die über ihre 
Sprache staunen, oder das Staunen lernen wollen, indem sie mithilfe des 
N-Gram-Viewers überprüfen, wie oft ein bestimmtes Wort oder eine be- 
stimmte Wortgruppe oder Namen, Spitznamen oder welche sprachlichen For- 
men auch immer in der Welt vorkommen, wie sich das Vorkommen im Lauf 


http://www.culturomics.org/cultural-observatory-at-harvard 
http://www.natcorp.ox.ac.uk/ 
http://www.dwds.de/ 


http://www.ids-mannheim.de/cosmas2/ 
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der Zeit verändert hat, welche Künstler öfter zitiert werden als andere, und so 
weiter, und so weiter. 

Die Charts, die das Programm in Sekundenbruchteilen erstellt, sind in der Tat 
faszinierend. Geschichtlich relevante Ausdrücke können minutiös nachver- 
folgt werden (Suche: The Great War, World War I), aber auch zufällig Rele- 
vantes, wie das Fach „Sozialpädagogik“, das Studenten an der Freien Universi- 
tät Bozen studieren, und das rasante Ansteigen der Belege dafür im letzten 
Jahrzehnt. Ebenso kann der Beginn der Verbreitung des Fachausdrucks „Zeig- 
feld“ in das Jahr 1934 datiert werden, oder „Deixis“, mit Karl Brugmann als 
Vorläufer um 1904. Solche rasch auffindbaren Ergebnisse, die auf einzelne 
Jahre eingeschränkt werden können und den direkten Zugriff auf die Quell- 
texte gestatten, haben nichts von einer „quick and dirty“-Informationsbeschaf- 
fung an sich. Sie verweisen mit Präzision auf Enklaven von spezialisiertem 
Sprachgebrauch durch Mitglieder einer wissenschaftlichen Gemeinschaft. 

Der Google-Such-Algorithmus sucht nach reinen Buchstabenfolgen — N-Grams -, 
die Suche ist daher auf Wörter eingeschränkt; es kann nicht nach Lemmata, 
also den jeweiligen Grundformen, gesucht werden, und es sind keinerlei Hin- 
weise auf semantische Differenzierungen möglich. Gerade bei sprachlich nicht 
geschulten Nutzern wird ein Bild von der Sprache und den Sprachen gefestigt, 
das auch im Schulunterricht eine feste Rolle einnimmt: Unser Bild von der 
Sprache ist stark von der Vorstellung vom Wort als Urelement der Sprachen 
geprägt. Wörter prägen sich ein, werden vergessen, stellen beim Übersetzen 
ein Hindernis dar und werden somit stark vom Kontext isoliert als eigenstän- 
dige Elemente der Sprache wahrgenommen. Aus der Perspektive schulischen 
Kontakts mit Sprache kommt als zweites Grundelement die Syntax hinzu, die 
Syntax als Summe der Regeln, die zum korrekten Gebrauch der Wörter ver- 
helfen. Von diesem Bild aus werden auch die Strategien zum Erwerb der 
Zweitsprache erfahren und bewertet, verstärkt durch den Gebrauch von Wör- 
terbuch und Grammatik als Referenzwerke im Umgang mit Sprachen, die ge- 
lernt werden müssen. 

Auf dieser Grundlage baut die neuere Forschung zur Sprache im Umfeld ih- 
res Gebrauchs auf und entdeckt dabei, dass zusätzlich zu den Wörtern Grup- 
pierungen von Wörtern in festen Gebrauchsformen, als eingespielte Versatz- 
stücke, eine große Rolle spielen, und dass die Verknüpfung der Wörter zu 
größeren Einheiten keineswegs nur als Zusammenbauen isolierter Elemente 
mithilfe von Regeln vor sich geht. Ganz im Gegenteil, Sprache operiert 
hochgradig mit mehr oder weniger rekurrenten mehrteiligen Mustern bzw. 
Konstruktionen. 
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Diese Erkenntnisse wurden in den letzten 20 Jahren im Rahmen der Sprach- 
forschung mit Korpusbelegen systematisch erweitert und konsolidiert, wobei 
nicht selten das Forschungsinteresse ftir Korpora und ftir Konstruktionen von 
Forschern in Personalunion vertreten wird (Stefan Gries mit einem umfangrei- 
chen Werk zu beiden Aspekten‘). 

Der zu erwartende Erfolg des N-Gram-Viewers von Google mit der Begeis- 
terung über rasch zu erzielende plausible Ergebnisse ist ein guter Anlass, die 
positiven Elemente dieser in den letzten Jahrzehnten diskutierten Versuche zu 
neuen Theorieansätzen in ein Gesamtbild zu vereinen, mit dem Ziel, eine 
Diskursgemeinschaft zu bilden, in der die nach Neuerungen drängenden EI- 
tern ebenso integriert werden wie Lehrpersonen und die für das Gedeihen der 
Schule verantwortlichen politischen Kräfte. 

Ein Ziel, das für das Wachsen dieser Diskursgemeinschaft angestrebt werden 
muss, ist, ein gemeinsames Bild der Sprachen in ihrer Funktionalität zu ge- 
winnen, ein Bild, das wissenschaftlich abgesichert ist, aber darüber hinaus auch 
anschaulich die Wege in die Praxis des Sprachkontakts und des Spracherwerbs 
aufzeigen kann. 

Es beginnt damit, die Grundanschauung, die wir von der Sprache haben, kri- 
tisch zu überprüfen. Niemand, der Sprache und Grammatik in der Schule ge- 
lernt hat, wird leugnen, dass „Wörter Einzelelemente sind, die mit Hilfe des 
Wissens um die Grammatik zusammen gesetzt werden“. Wir könnten mit 
Lessing antworten: „Ich bin dieser Niemand“, und zwar in Übereinstimmung 
mit einer großen Zahl von Vertretern unterschiedlicher Richtungen der 
Sprachwissenschaft, die zu einer Sicht der Sprache gefunden haben, in der 
Wort und Syntax nicht als getrennt angesehen und behandelt werden. Diese 
neue Sicht der Sprache(n) hat weitreichende Folgen für die Sprachwissen- 
schaft, inklusive der angewandten Sprachwissenschaft in den Bereichen des 
Spracherwerbs, des Übersetzens und der Sprachpflege im Umfeld institutio- 
nellen Sprachgebrauchs. 

In all diesen Bereichen ist in einem bestimmten Stadium des Erlernens von 
„skills“ die Aufmerksamkeit zu schulen, die Wahrnehmung von Mustern zu 
entwickeln und zu üben. Dazu ist, wie unzählige Studien, Theorieansatze und 
die Erfahrung vieler Sprachlerner in der Kontaktsituation einer mehrsprachi- 
gen Lebensumwelt zeigen, weit mehr als ein unbeteiligtes Hinschauen auf die 
sprachlichen Elemente nötig, die vor unsere Augen (oder Ohren) treten. Spra- 
che muss voll und ganz verstanden werden und in einem als sinnvoll erfahre- 
nen Kontext der eigenen Lebenswelt als wirksam erkannt werden. 


6 http:/www.linguistics.ucsb.edu/faculty/stgries/ 
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Nicht die unentwegte Sprachberieselung ist entscheidend, sondern das Auf- 
nehmen voll verstandener Sprache in sinnvollen Lebenskontexten. Für den 
Zweitsprachunterricht hat das Lily Wong Fillmore exemplarisch in ihrer oft 
zitierten Dissertation ausgesprochen: “Exposure to language is not enough; it 
must be directed at the learner, and shaped with his needs and abilities in 
mind.” (Fillmore 1976’, 119). In der neueren Forschung spricht man von „in- 
take“ im Gegensatz zum rein mechanischen „input“, der auch ohne Spuren zu 
hinterlassen wieder verschwinden kann. Diese Beobachtungen, Erfahrungen 
und Theorieansätze zum Fremdsprachenlernen und zum Zweitspracherwerb 
stellen einen möglichen Hintergrund für den Einsatz von Korpusinstrumen- 
ten im Sprachunterricht dar. 

Dazu kommt in einer mehrsprachig orientierten Gemeinschaft wie der in 
Südtirol - in diesem Kontext wählen wir den italienischen Ausdruck „comuni- 
tä di pratica“, der metonymisch dem deutschen Ausdruck „Diskursgemein- 
schaft“ entspricht — der Vorteil, dass unsere Lernenden sinnvolle Suchen/Kor- 
pusrecherchen in den drei Schulsprachen durchführen und sehr rasch auch 
tatsächlich selbständig durchführen können. Sehr oft ist es gerade die uner- 
wartete Herausforderung, das gerade erst entdeckte Erkenntnispotential des 
neuen Instrumentes für individuelle Fragestellungen in einer Sprache auch für 
andere Sprachen zu nutzen und selbständig analoge Suchanfragen in mehre- 
ren Sprachen zu konfigurieren, die zum Auslöser für ein nachhaltiges Interesse 
an Sprache, an Sprachformen und -mustern wird. 


7 Fillmore, Lily Wong (1976): The second time around: cognitive and social strategies in second language 
acquisition, Ph.D. dissertation, Stanford. 
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Korpus Südtirol — Aufbau und Abfrage 


Stefanie Anstein - Europäische Akademie Bozen 
Margit Oberhammer - Freie Universität Bozen 
Stefanos Petrakis - Universität Zürich 


Abstract 

Dieser Beitrag gibt einen Einblick in die Initiative Korpus Südtirol und die ca. 70 Mil- 
lionen annotierte Tokens umfassende Textsammlung sowie in deren Anwendungs- 
möglichkeiten. Der inhaltlichen Beschreibung der Textbasis folgt eine Erklärung der 
technischen Arbeitsschritte zur Korpusaufbereitung und die Vorstellung der Benut- 
zeroberfläche. Das Korpus Südtirol dokumentiert die geschriebene Sprache des 20. 


Jahrhunderts in Südtirol und dient als Instrument für linguistische Untersuchungen. 


1. Einführung 

Die deutsche Sprache ist in der Autonomen Provinz Bozen / Südtirol (Italien) 
der italienischen gleichberechtigte Amtssprache, festgelegt im Autonomiesta- 
tut! (Art. 99, 100; erstes Abkommen: Pariser Vertrag 1946). In den ladinischen 
Tälern kommt Ladinisch als dritte Amtssprache hinzu. Von den ca. 500.000 
Einwohnern Südtirols sind etwa zwei Drittel deutscher Muttersprache, ein 
Viertel italienischer und der Rest ladinischer Muttersprache. Deutsch wird in 
nahezu allen Bereichen des öffentlichen Lebens parallel zum Italienischen 
verwendet - in den Medien, in Schulen, Weiterbildungsinstituten oder in der 
öffentlichen Verwaltung. 

Die deutsche Sprache weist Unterschiede zwischen ihren Varietäten in 
Deutschland, Österreich, der Schweiz sowie in weiteren sogenannten nationa- 
len Halbzentren wie Südtirol auf (vgl. Ammon 1995a und 1995b). Diese Un- 
terschiede bestehen auf verschiedenen Ebenen, von der Aussprache- über die 
Wort- bis zur Satzebene. Wortbeispiele für die Südtiroler Varietät sind Kondo- 
minium, Halbmittag, Proporz, Waal oder Maturant (vgl. Ammon et al. 2004 
und Abfalterer 2007). 

Während eine historische und gesellschaftspolitische Auseinandersetzung mit 
der Vergangenheit in Südtirol in den 80er Jahren des vergangenen Jahrhunderts 
eingesetzt hat, gibt es im sprachlichen Bereich noch große Lücken. Was Wolf- 
gang Klein für den gesamten deutschsprachigen Raum feststellt, die weitgehend 
im Dunkeln liegenden Sprachverhältnisse in der ersten Hälfte des 20. Jahrhun- 


1 <http://www.provinz.bz.it/land/landesverwaltung/suedtirol/autonomiestatut.asp> (Stand: Jänner 2011) 
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derts, trifft für Südtirol in besonderem Maße zu. Auch hier ist der unzureichen- 
de Forschungsstand nicht zuletzt „ein Indiz für die mangelnde Fähigkeit, sich 
den Texten der Vergangenheit zu stellen und die Sprache dieser Texte als das 
Fundament der Gegenwartssprache zu begreifen“. 

Die Textsammlung des Korpus Südtirol soll zur Auseinandersetzung mit der 
sprachlichen Vergangenheit anregen, mit der Geschichte der deutschsprachi- 
gen Schriftlichkeit des 20. Jahrhunderts in Südtirol. Ziel ist u.a. ein besseres 
Verständnis des gegenwärtigen Sprachgebrauchs. 


Das Korpus Südtirol dokumentiert die geschriebene deutsche Sprache in Süd- 
tirol und hat eine wichtige Archivfunktion. Es wird für linguistische Untersu- 
chungen (s. auch Beitrag Abel/Anstein in diesem Band) sowie für Sprachauf- 
merksamkeitsförderung und Didaktik (s. Beitrag Zanin in diesem Band) 
verwendet. Die mit Metainformationen angereicherten Texte stellen zudem 
eine Basis für philologische und stilistische Vergleiche dar, für Beobachtungen 
von Sprachwandelphänomenen und von textsortenspezifischem Sprachge- 
brauch. 

Das Korpus Südtirol beteiligt sich an der Initiative C4, die vier der deutschen 
Varietäten in Europa zusammenfassend dokumentiert und den öffentlichen 
Zugang zu vergleichbaren Korpora der folgenden Arbeitsstellen anbietet: 
DWDS° - Das Digitale Wörterbuch der deutschen Sprache des 20. Jh. der Berlin- 
Brandenburgischen Akademie der Wissenschaften, 44C° - Austrian Academy 
Corpus der Österreichischen Akademie der Wissenschaften in Wien, Schwei- 
zer Text Korpus’ des Deutschen Seminars der Universität Basel. 


2, Textbasis und Metadaten 

Um eine ausgeglichene und möglichst repräsentative Textsammlung zu erhal- 
ten, werden in Anlehnung an das DWDS-Korpus vier Textsorten zu gleichen 
Teilen für das 20. Jahrhundert bis heute gesammelt: Belletristik, Gebrauchs- 
texte, journalistische Prosa und Sachtexte.® 


Klein, Wolfgang: <http://www.bbaw.de/forschung/dwds/projektdarstellung > (Stand: Jänner 2011) 


O N 


s. auch <http://www.korpus-suedtirol.it> (Stand: Jänner 2011) für weitere Informationen, Literaturangaben 
sowie den Link zur Suche in verschiedenen Teilkorpora 


<http://www.korpus-c4.org> (Stand: Jänner 2011) 
<http://www.dwds.de> (Stand: Jänner 2011) 
<http://www.aac.ac.at> (Stand: Jänner 2011) 
<http://www.dwds.ch> (Stand: Jänner 2011) 


zur zeitlichen Planung s. Kapitel 3. 
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Die Quantität, Qualität und zeitliche Verteilung muss vor dem Hintergrund 
der geschichtlichen Situation Südtirols im 20. Jahrhunderts gesehen werden.’ 
Bis zum Ende des Ersten Weltkriegs ist Südtirol mit 250.000 deutschsprachi- 
gen BewohnerInnen Teil Tirols und gehört somit zu Österreich, beziehungs- 
weise zur späten Donaumonarchie. Literarisches und wissenschaftliches Zent- 
rum am Beginn des 20. Jahrhunderts und häufiger Publikationsort der 
Druckerzeugnisse ist Innsbruck. Nach der Abtrennung von Österreich und 
während des erstarkenden italienischen Faschismus gehen in den 20er Jahren 
die schriftlichen Quellen bis auf einige wenige Erzeugnisse in Kleinstverlagen 
völlig zurück. Gab es 1925 noch drei Tageszeitungen und eine Vielzahl ver- 
schiedener Wochen- und Monatszeitschriften, so wurden diese im Jahr darauf 
durch das faschistische Pressegesetz verboten. In den späten 30er und in der 
ersten Hälfte der 40er Jahre fördert die Politik des Nationalsozialismus vor al- 
lem eine bestimmte Sorte des regionalen Schrifttums, die Heimatliteratur. Die 
Romane von Joseph Georg Oberkofler, Franz Tumler, Maria Veronika Rubat- 
scher und Luis Trenker erscheinen in hohen Auflagen in Verlagen in Deutsch- 
land. In der Nachkriegszeit hinterlassen die beiden Diktaturen eine Bildungs- 
katastrophe, die sich bis weit in die 60er Jahre hinein bemerkbar macht. 
Zudem sind nach dem Zweiten Weltkrieg Politik, Medien und Literatur eng 
miteinander verflochten und das Verlags- und Pressewesen ist monopolisiert. 
Publiziert werden wiederaufgelegte Texte aus den 30er Jahren, Kalender- und 
religiöse Literatur. Kulturelle Institutionen bemühen sich vor allem um die 
Pflege der volkstümlichen Kultur und deren sprachlichen Erzeugnissen. Seit 
der Durchsetzung der Autonomie in den 70er Jahren und dem wirtschaftli- 
chen Aufschwung seit den 80er Jahren blühen Presse- und Verlagswesen. Die 
deutsche Sprache gewinnt verlorengegangene Verwendungsdomänen zurück 
und ihr Prestige wird gehoben. In den schriftlichen Quellen zeigen sich Prob- 
lembewusstsein und Interesse an der kritischen Auseinandersetzung mit Ver- 
gangenheit und Gegenwart. Das inhaltliche und sprachliche Spektrum der 
Texte wird breiter. 


2.1 Kriterien für die Zusammensetzung 
Die Zusammensetzung der Textbasis lehnt sich an jene des Kernkorpus des 
Digitalen Worterbuchs der deutschen Sprache und an das Schweizer Text Korpus an. 


2.1.1 Formale Kriterien 
Aufgenommen werden Druckwerke und maschinenschriftliche Texte (publi- 
zierte Diplomarbeiten und Dissertationen) in Prosa. Ein wichtiges Kriterium 


9 s.auchbei Steininger, Rolf: <http://www.rolfsteininger.at> (Stand: Jänner 2011) 
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für die Aufnahme ist der Status der Urheberrechte. Die Textsammlung be- 
schränkt sich in erster Linie auf Standardsprachliches. Dazu zählen auch Texte 
in stilisiertem standardnahem Dialekt, wie er in Dramen einiger Südtiroler 
AutorInnen verwendet wird. Das Korpus Südtirol ist formal wie erwähnt in die 
vier Kategorien Belletristik, Sachtexte, Journalistische Prosa und Gebrauchs- 
texte eingeteilt. Es geht bei der Einteilung weniger um eine genaue Texttypo- 
logie als vielmehr um eine große Bandbreite an Textsorten. Eine ausgewogene 
Verteilung dieser Textsorten wird nach Möglichkeit angestrebt. Bei Texten, 
deren Verfasser bekannt sind, sind dies AutorInnen, die in Südtirol geboren 
und/oder den Großteil ihres Lebens dort verbringen oder als RedakteurInnen, 
HerausgeberInnen und PublizistInnen einen maßgeblichen Einfluss auf die 
geschriebene Sprache haben. 


Belletristik Beinhaltet möglichst viele unterschiedliche Gattungen, 

ausgenommen Lyrik (Romane, Novellen und Erzählun- 
gen, Biographien, literarische Briefe, Essays, Sagen, Mär- 
chen, Städtebilder, Heimatliteratur, Kriminalgeschichten, 
Trivialliteratur, Kinderliteratur, Kalenderliteratur, Antho- 
logien, Dramentexte). 
Aufgenommen in diese Kategorie wurde auch autobio- 
graphische Literatur, die in Südtirol eine wichtige Rolle 
spielt und für sprachliche Untersuchungen vor allem im 
Bereich der Varietätenlinguistik aufschlussreich ist: Ta- 
gebücher, Kindheitserinnerungen, Kriegserinnerungen, 
Reisebeschreibungen, Bergsteiger- und Expeditionsbe- 
richte. 

Journalistische Prosa Südtirol weist im 20. Jahrhundert eine sehr wechsel- 
volle Zeitungsgeschichte auf mit vielen Neugründun- 
gen, Verboten, Unterbrechungen Wiederaufnahmen, 
kurzlebigen Blättern. Die Aufnahme der Tages- und 
Wochenzeitungen geschieht in enger Kooperation mit 
der Landesbibliothek Dr. Friedrich Tefsmann, die bereits 
die meisten historischen Südtiroler Zeitungen digitali- 
siert hat (z.B. Brixner Chronik, Der Tiroler, Bozner Zei- 
tung, Bozner Nachrichten, Burggräfler, Pustertaler Bote, 
Der Pfeil, Tandem, Dolomiten...). Zusätzlich Magazine 
(5 IN Südtirol, Südtiroler Wirtschaftszeitung), Studen- 
tenzeitungen (Der fahrende Skolast, Quer), unregelmäßig 
erscheinende Zeitungen von Vereinen und Verbänden 
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(Theaterverband, Sängerbund, Gastwirteverband, Im- 
kerverband, Handwerkerverband), Veröffentlichungen 
des Landespresseamtes, Bezirks- und Gemeindeblätter. 

Sachprosa Texte aus verschiedenen Fachgebieten: populärwissen- 
schaftliche Aufsätze in Zeitschriften (Der Schlern, 
Arunda), in Jahrbüchern und Tagungsbänden ebenso 
wie umfangreichere, im engeren Sinn wissenschaftliche 
Texte (auch Diplomarbeiten und Dissertationen). 
Außerdem Monographien und themenspezifische Zeit- 
schriften (Geschichte und Region, Theologisches Fo- 
rum, Zeitschrift des Burgeninstituts- arx, forum- Schu- 
le heute). 

Gebrauchstexte Als Gebrauchstexte wurden „Texte für jemanden“ kate- 
gorisiert (Schulbücher, Gesundheitsratgeber, Kochbü- 
cher, Wanderführer, Gebietsführer, Gebrauchsanwei- 
sungen, Werbetexte, Programmhefte, Verordnungen). 


2.1.2. Zeitliche Kriterien 

Die Textgrundlage soll möglichst repräsentativ das geschriebene Südtiroler 
Deutsch des 20. Jahrhunderts erfassen und wird zudem regelmäßig durch Tex- 
te aus dem 21. Jahrhundert ergänzt und erweitert. Der Textbestand wird wie 
im Korpus des DWDS in Dekaden gegliedert. Ein zentrales Kriterium für die 
Aufnahme eines Textes ist das Publikationsjahr. 


2.1.3. Inhaltliche Kriterien 

Es werden Texte aus sehr unterschiedlichen Themengebieten gesammelt, aus 
den Bereichen: Philologie, Pädagogik, Rechtskunde, Wirtschaftswissenschaf- 
ten, Technik, Musik- und Theaterwissenschaften, Medizin, Philosophie, Lan- 
deskunde, Volkskunde, Geschichte, Geografie, Geologie, Botanik, Kunstge- 
schichte, Archäologie, Theologie. Die inhaltliche Erschließung erfolgt mit 
dem Dewey-Dezimalklassifikationssystem™, der international am weitesten 
verbreiteten Klassifikation für Bibliotheksbestände. 


2.2. Quellen für die Metadaten 

Die bibliographische Situation in Südtirol ist insgesamt eine besondere, weil 
es ähnlich wie für Nordtirol für das 20. Jahrhundert keine fortlaufende biblio- 
graphische Berichterstattung gibt und die bibliographischen Daten aus unter- 
schiedlichen analogen und digitalen Quellen recherchiert werden müssen. Im 


10 <http://www.dde-deutsch.de> (Stand: Jänner 2011) 
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Folgenden werden die wichtigsten Lexika, Datenbanken, Bibliotheken und 
Internetarchive!! aufgelistet. 


2.2.1. Belletristik 


<http://www.literature.at> (alo - austrian literature online) 
<http://www.biographien.ac.at> (Österreichisches Biographisches Lexi- 
kon - Online Edition) 

<http://www.uibk.ac.at/brenner-archiv> (Literaturdatenbank) 
<http://www.kuenstlerbund.org/de> (Dokumentationsstelle für Neuere 
Südtiroler Literatur) 

ausgewählte deutschsprachige Buchveröffentlichungen Südtiroler Auto- 
rInnen seit 1990: In: (W)orte. Zeitgenössische Literatur aus und über 
Südtirol (2005); herausgegeben, kommentiert und übersetzt von Siegrun 
Wildner. Innsbruck-Bozen-Wien: Skarabaeus 

Gruber, Alfred (Hrsg.)(1990): Nachrichten aus Südtirol. Deutschspra- 
chige Literatur in Italien. (=Auslandsdeutsche Literatur der Gegenwart. 
Band 4.), Hildesheim: Verlag Georg Olms AG 

Enzinger, Moritz: Die deutsche Tiroler Literatur bis 1910 - Ein Abriß. 
Wien, 1929 

Deutsches Literatur-Lexikon (1968 ff), 3. Auflage. Bern, München, 
Stuttgart: Francke. 

Oberschelp, Reinhard (Hrsg.)(1976): Gesamtverzeichnis des deutsch- 
sprachigen Schrifttums (GV). 1911-1965. München, u.a.: Saur. 


2.2.2. Journalistische Texte 


<http://www.provinz.bz.it/lpa/medienverzeichnis.asp> (Online-Medien, 
Bezirksblatter, Gemeindeblatter, Monatsschriften) 
<http://www.press-guide.com/italy.htm> (deutschsprachige Tages- und 
Wochenzeitungen) 

<http://www.provinz.bz.it/lpa> (Landespresseamt) 

Demattia, Roman: Verzeichnis der in Südtirol erschienenen Zeitschrif- 
ten und Periodika von 1945 bis 1978 (einschließlich solche der Provinz 
Trient, soweit sie sich auf die gesamte Region Trentino-Südtirol bezie- 
hen), die in Bibliotheken Südtirols einschließlich der Universitätsbiblio- 
thek Innsbruck und des Tiroler Landesmuseums Ferdinandeum vorhan- 


den sind. (Wissenschaftliche Hausarbeit) Bozen 1980. 
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Kugler, Dorothea: Die Südtiroler Periodika bis 1945: Standortnachweis 
und statistische Auswertungen. (wissenschaftliche Hausarbeit) Bozen 
1988. 


2.2.3. Sach-/Fach- und Gebrauchsprosa 


< http://www.tessmann.it> (Tirolensien und digitales Zeitungsarchiv) 
<http://www.uibk.ac.at/ulb/information/bibliographie.html#tirolensien> 
(Tirolensienabteilung der Universitàtsbibliothek Innsbruck) 

Buchland Tirol 1980-1990 (1991) Südtirol, Nordtirol, Osttirol. Litera- 
tur-Handbuch und Tirolensienverzeichnis; hrsg. v. Südtiroler Landes- 
regierung und Amt der Tiroler Landesregierung. Bearbeiter: Ferruccio 
Delle Cave, Kurt Habitzel, Anton Sitzmann, Toni Unterkircher. Wissen- 
schaftliche Beratung: Johann Holzner. Bozen-Innsbruck: Amt der Tiroler 
Landesregierung und Südtiroler Landesregierung. 

Der Schlern. Monatszeitschrift für Südtiroler Landeskunde. Verfasser-, 
Personen-, Orts-, Sach- und Bildregister: Register für die Jahrgänge 
1920-1978 (1979). Bearbeiter: Hans Griessmair. Bozen: Athesia. 
Pfaundler-Spat, Gertrud (2005): Tirol Lexikon. Ein Nachschlagewerk 
über Menschen und Orte des Bundeslandes Tirol. Innsbruck Wien Bo- 
zen: Studienverlag 

Habitzel, Kurt: Literatur und Literaturbetrieb in Tirol im Zeichen des 
Anschlusses. Innsbruck 1990 (Diplomarbeit) 

Auer, Werner, Kurt Gamper (1984): Tirol, schöpferisches Land. Steiger 
Verl., Innsbruck: Steiger Verlag 

Archivkatalog des Universitätsverlags A. Weger Brixen 

Archivkatalog des Verlags Athesia Bozen 

Bibliothekskatalog des Tiroler Landesmuseums Ferdinandeum Inns- 
bruck 


3. Datenbank und Aufbereitung 

In der Bestandsaufnahme-Datenbank des Korpus Südtirol befinden sich ca. 
294.000 Einträge mit Metadaten, die manuell und automatisch erstellt wur- 
den. Jeder Eintrag beschreibt ein „Werk“, d.h. einen Text mit einem eindeuti- 
gen Titel und einem bestimmten Autor. Abbildung 2 zeigt eine Übersichtssta- 
tistik der in der Bestandsaufnahme befindlichen Werke an Hand von 
Seitenzahlen. 
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Abb. 2: Übersicht der Einträge in der Bestandsaufnahme des Korpus Südtirol, sortiert nach 
Textsorten und Dekaden, dargestellt auf der Grundlage von Seitenzahlen 


Zur Erstellung einer formatierten Bibliographie wurde ein Werkzeug entwi- 
ckelt, mit dem die gewünschten Texttypen, Dekaden und die Art der Sortie- 
rung ausgewählt werden kann. 


Zu jedem Eintrag in der Bestandsaufnahmendatenbank werden halbautoma- 
tisch eine Reihe von Metadaten erfasst. Ein Auszug ist in Abb. 4 zu sehen. 
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SourceTitle 
SourceSubtitle 
ConversionType 
SourceExtentPagecount 
SourceLocation 
SourcePublicationISBN 
SourcePublicationWhere 
SourcePublicationWho 
SourcePublicationYear 
TaxonomyPublicationType 
TaxonomySourceFormat 
TaxonomyOriginalTypeface 


TaxonomyTextCategory 


Tschonnie Tschenett - Grobes Foul 
Kriminalroman 
analog 

189 
Tessmann-Bibliothek 
3-85218-148-8 
Innsbruck 

Haymon 

1993 

Buch 

analog 

Antiqua 

Belletristik 


Abb. 4: Auszug aus der Datenbank zur Erfassung der detaillierten Metadaten fùr die Be- 


standsaufnahmeneintrage 


Jeder Datenbankeintrag, der sich wie erwahnt auf ein Werk (Artikel, Buch 
etc.) bezieht, wird mit dem Eintrag zu seinem Autor verlinkt. Abb. 5 zeigt das 
Beispiel zum vorher beschriebenen Bucheintrag. 


FullName Kurt Lanthaler 
Surname Lanthaler 
ForeName Kurt 
YearOfBirth 1960 
YearOfDeath | - 

BirthPlace Bozen 


Abb. 5: zum Eintrag in Abb. 4 gehòrige Autorenmetadaten 
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Die Informationen in der Datenbank werden mit Hilfe eines speziellen Pro- 
gramms in ein nach den Richtlinien der Text Encoding Initiative” giltiges 
XML*®-Dokument umgewandelt. Ein Ausschnitt aus dem vorliegenden Bei- 
spiel ist in Abb. 6 zu schen. 


— <teiHeader id="id1191453784723"> 
— <fileDesc> 
— <titleStmt> 
— <title> 
schonnie Tschenett - Grobes Foul [Machine readable version] 
</title> 
— <author> 
— <persName> 
<name type="full">Kurt Lanthaler</name> 
<foreName>Kurt</foreName> 
<surname>Lanthaler</surname> 
</persName> 
</author> 
— <respStmt> 


Abb. 6: zum Eintrag in Abb. 4 gehöriges XML-Dokument 


Teilweise liegen Texte bereits in elektronischer Form vor; ein Großteil muss 
jedoch zunächst digitalisiert werden. Nach der erfolgten Digitalisierung wer- 
den die XML-Daten von Text und Metadaten-Header zusammengefügt und 
ergeben somit eine mit Metadaten angereicherte Textbasis, aus der an Hand 
verschiedenster Kriterien Subkorpora halbautomatisch erstellt werden können. 


Bisher wurden rund 70 Millionen laufende Textwörter vollständig aufbereitet 
und abfragbar gemacht. Ein Großteil davon (ca. 66 Millionen Wörter) besteht 
aus Texten der Tageszeitung Dolomiten der Jahre 1991-2006, die uns der Ver- 
lag Athesia mit einem Nutzungsvertrag zur Verfügung gestellt hat. Der Rest 
beinhaltet verschiedene belletristische Werke oder auch neuere Zeitschriften. 
In einem knapp 2 Millionen Textwörter beinhaltenden Subkorpus steht ein 
zeitlich und textsortenbezogen ausgeglichenes Korpus zur Abfrage zur Verfü- 
gung, dessen Anreicherung über die nächsten Jahre weiterlaufen soll. 


12 <http://www.tei-c.org/release/doc/tei-p4-doc/html> (Stand: Jänner 2011) 
13 Extensible Markup Language; <http://www.w3.org/TR/xml11> (Stand: Jänner 2011) 
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Die Texte wurden tokenisiert, d.h. in kleinste sinnvolle Einheiten auf Wort- 
ebene (Wörter, Satzzeichen) zerlegt, und linguistisch mit Wortart- und Lem- 
ma-Informationen annotiert, d,h, angereichert (TreeTagger, Schmid 1994). 
Der Chunker YAC (Kermes 2003) diente teilweise zur weiteren Annotation 
von Chunks (grammatikalisch zusammengehörige Elemente eines Satzes; s. 
Abney 1991) und morphosyntaktischen Annotationen, z.B. Kasus und Nume- 
rus von Substantiven.'* 

Verwendete Abfragesysteme zum Auffinden von bestimmten Lemmata oder 
Mustern in annotierten und aufbereiteten Korpora sind die Korpuswerkzeuge 
des Instituts für Maschinelle Sprachverarbeitung (IMS): CorpusWorkBench 
(Christ 1994) und Corpus Query Processor COP (Evert 2005), auf denen die 
eigens erstellte Benutzeroberfläche aufbaut. Für interne Anwendungen kommt 
auch die Sketch Engine (Kilgarriff et al. 2004) zum Einsatz. 


4. Abfrageoberfläche und Benutzerzugang 

Die Registrierung zur Benutzung der Abfrageoberfläche kann unter <http:// 
www.korpus-suedtirol.it>, Menüpunkt Suche in den Korpora, durchgeführt wer- 
den. 

In dieser Benutzeroberfläche können drei verschiedene Arten von Suchober- 
flächen verwendet werden. Die Einfache Suche ist für Einsteiger ohne Korpus- 
erfahrung konzipiert, die Erweiterte Suche spricht Nutzer an, die bereits Erfah- 
rung mit Korpusarbeit und linguistisches Wissen haben und über die 
Expertensuche können Anfragen in der CQP-Spezialsyntax gestellt werden. 
Einige Beispiele für verschiedene Anfragen werden im Folgenden dargestellt. 
Für Einzelwortsuchen ist die Einfache Suche ausreichend. Ihr Suchfenster ist 
ähnlich einer Internetsuchmaschine zu benutzen. Ein Beispiel ist in Abb. 7 
und 8 zu sehen. 


14 Für weitere Details zur Korpusaufbereitung s. Lemnitzer/Zinsmeister 2006. 
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Korpus Sudtirol 


Finfache Suche 7 Erwaitate Suche’ Expertensuche? Main Profi? 7 © Suche im Korpus 7 Korpus Südtirol + 
bm a pen 
20 Ergebnisse Insgesamt im Korpus Korpus Südtirol fur Quastur 


Sette: 1 + 
1: sstallung des Reisepasses nicht dem Ermessen der Quastur oder anderer Behörden überlassen. vielmehr hatjedert + (du 
2: si geselbatmordet - aus einem Fenster der Mailänder Quästur  Ebensolang sit Pietro Valpreda schwer krank im Mail’ + 19 
3. Jagte zum Fenster hinauszuwerfen . }. "Die römische Quästur " vergißl” das Alibi des Faschisten Merlino zu überprüfen + (J © 
4: acer aröffnet werden . Es wurde uns geraten . auf der Quastur weitere Informationen einzuholen . Dort verwies man un: + Qa 


5: bedienen kann: eines interministenelien Komitees über die Geheimdienste , und des Cesis , des bereits -m 
genannten Bindegliedes zwischen Sismi , Sisde und den einzelnen Geheimdienstabteilungen ‚über die jede 


Ministarprasicenten an das Panament ausgeübt (lle Sechs 
Gesetrasiage aber enentalis nicht bringen , wie 
8: frag direkt vom Polizeikommissar Saverio Molino der Quästur Trient bekommen habe Die Zeitschrift wird verkiagi ab + bd D 
7: it Beamter der Digos . die als politische Abtelluno der Quästur operiert . sondern bei dessen Pendant im Dienst. derm + (a 
8: gramm der Carabinieri, das am 9. Juni 1986 Del der Quastur eingeht, die zengleich gegen Obwegs ermittelt. Der Fun + lè 
9 wen Behörden - Carabinieri und politische Polizei der Quästur - Zusammenspannt . Und schon vorher , am späten Nac + QU 
10; zei von sich aus auf Sundin gekommen sei . Auf der Quästur sind die Kopien aller Milgliedsausweise des Südtiroler + (2 2 


Abb. 7: Anfrage an das Korpus Südtirol mit der Option Einfache Suche 


Korpus Südtirol 


Finfache Suche ” Erwaitete Suche” Expertensuche?” Main Profi? ? © Suche im Korpus 7 Korpus Südtirol + 
o pei 
20 Ergebnisse Insgesamt im Korpus Korpus Südtirol für Quastur 


Sene: 1 + 
1: sstallung des Reisepasses nicht dem Ermessen der Quastur oder anderer Behörden überlassen. vielmehr hatjederi + (di 
2: sigeselbsimordel - aus einem Fenster der Mailänder Quästur  Ebensolang sit Pietro Valpreda schwer krank im Mail? + KID 
3; Jagte zum Fenster hinauszuwerfen . }. "Die römische Quästur * vergißt” das Alibi des Faschisten Merlino zu Gberprifer + Id Li 
4: eer eröffnet werden . Es wurde uns geraten. auf der Quästur weitere Informationen einzuholen . Dort verwies man un: + Ro 
5: bedienen kann : eines interministenelien Komitees über die Geheimdienste , und des Cesis , des baraits Ri 
genannten Bindegliedes zwischen Sismi , Sisde und den einzelnen Geheimdienstabteilungen ‚über die jede 
Polizeieinheit zusätzlich verfügt . vor allem Carabinieri „ Eear 4 brain „Die parlamentarische 


Gesetrasiage aber enentalis nicht bringen , wie 
8: frag direkt vom Polizeikommissar Saverio Molino der Quästur Trient bekommen habe Die Zeitschrift wird vorklagt ab + ID 
7: tt Beamter der Digos . die als pollische Abteilung der Quästur operiert. sonder bel dessen Pendant im Dienst. der m + Qi 
8: gramm der Carabinieri, das am 9. Juni 1986 dei der Quastur eingent , die zeitgleich gegen Obwegs ermittelt. Der Fun + lè 
9 wen Behörden - Carabinieri und politiche Polizei der Quästur - Jusammenspann Und schon vorher , am späten Nac + QU 
10, zei von sich aus auf Sandrini gekommen sei . Auf der Quästur sind die Kopien aller Migliedsausweise des Südtiroler + (QB 


Abb. 8: Ergebnis der Anfrage aus Abb. 7 


Mit der Erweiterten Suche können komplexere Anfragen gestellt werden, die 
auch die Annotationen in die Suche mit einbeziehen, z.B. „alle Adjektive, die 
vor dem Wort Stimmzettel vorkommen“ (Abb. 9). 
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Einfache Suche” Hrwinteite S ? Expertensuche” Mein Profil” ? © Suche im Korpus:? Dolomiten - 
[i + Stimmzettel ] o t 
1. Wortform oder Lemma 
è Le 
2. Wortart (optional) 
apart [J] Advert: P 
Partite f Prapon 
Vert | ndere | 
3. Gro8~Kieinschreibung 
m @ lynoriere 


4. Anzahl 


1. oder 


Abb. 9: Anfrage an das Korpus Südtirol mit der Option Erweiterte Suche 
Die Expertensuche erlaubt Anfragen mit regulären Ausdrücken nach der CQP- 


Syntax, wenn z.B. alle Nomina mit dem Präfix „Vor-“ gefunden werden wollen 


(Abb. 10). 


Be 5 


Einfache Suche ° Erweiterte Suche ? + xpertensuche Mein Profil? ? © Suche im Korpus: Korpus Südtirol = 


[inos NN" & word« Vor jo frinn haue] 


Abb. 10: Anfrage an das Korpus Südtirol mit der Option Expertensuche 


5. Ausblick 


Im weiteren Fortgang der Initiative ist eine umfassende Korpusanreicherung 
auf Grund der erstellten Bestandsaufnahme geplant, um die Sprachdokumen- 
tation, -untersuchung und -didaktik in Südtirol zu unterstützen. Zusätzlich 
sollen weitere Spezialkorpora hinzugefügt werden, z.B. Lernertexte und paral- 
lele Korpora. Die Annotationen werden erweitert, auch durch die Anpassung 
der Annotationswerkzeuge an die Südtiroler Varietät. Des Weiteren werden 
Werkzeuge zum systematisierten Vergleich von Varietätenkorpora weiterent- 
wickelt (Abel/Anstein in diesem Band und Anstein 2009) und umfassende 
Analysen durchgeführt. 
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Abstract 

Ein Überblick über relevante Arbeiten zur deutschen Sprache in Südtirol seit 
den 60er Jahren und davon abgeleitete Forschungsdesiderate bilden im folgen- 
den Beitrag den Ausgangspunkt für eine systematische Untersuchung und Er- 
fassung von möglichen Besonderheiten des Deutschen in Südtirol auf ver- 
schiedenen sprachlichen Ebenen, für die nun erstmals eine durch 
computerlinguistische Werkzeuge aufbereitete Datensammlung zur Verfügung 
steht: das im Entstehen begriffene Korpus Südtirol!. Vor diesem Hintergrund 
werden methodische Ansätze sowie erste linguistische Untersuchungen und 
eine Reihe von Fallstudien vorgestellt und erläutert. Sie bieten wertvolle An- 
haltspunkte für vertiefende Untersuchungen und die (Weiter-)Entwicklung 
von Werkzeugen zum semiautomatischen Varietätenvergleich. Auf diese Wei- 
se ist es möglich, bisherige Ergebnisse aus der Sprachkontakt- und Varietäten- 
forschung zu untermauern sowie zu ergänzen und — unter Rückgriff auf aktu- 
elle Verfahren und Methoden - einen Beitrag zur Beschreibung der deutschen 
Sprache Südtirols zu leisten. 


1. Einleitung 

Die deutsche Sprache in Südtirol ist in vielerlei Hinsicht interessant für ver- 
gleichende linguistische Untersuchungen. Forschungsbedarf ergibt sich dabei 
zum einen aus der marginalen Lage des nationalen Halbzentrums Südtirol 
(zum Begriff siehe Ammon 1995a und 1995b) im Hinblick auf die Varietäten 
des plurizentrischen Deutschen, zum anderen aus der Sprachkontaktsituation 
bzw. den vielschichtigen Diglossie- und Polyglossiesituationen, die sowohl den 
Gebrauch als auch die Entwicklung der Sprache(n) im mehrsprachigen Kon- 
text maßgeblich bestimmen. Veränderungen im Sprachgebrauch und Sprach- 
wandel gehören zur inneren Dynamik von Sprachen. Sprachliche Normen 
sind demgegenüber stabiler, aber auch sie unterliegen Veränderungen in der 
Zeit, und damit verbunden sind Veränderungen in der Beurteilung und Be- 


1 <http://www.korpus-suedtirol.it> (Stand: Jänner 2011) 


29 


30 


Andrea Abel, Stefanie Anstein 


wertung dessen, was ihnen entspricht. Was zunächst noch verbindlich ist, stellt 
sich später als Abweichung von Normen und Konventionen dar (vgl. Sitta 
2001; Sieber/Sitta 1994). Daher gilt es, regelmäßig und systematisch zu beob- 
achten und zu untersuchen, ob in einer Sprachgemeinschaft sprachliche Ver- 
luste und Defizite festzustellen sind und worauf sie sich zurückführen lassen. 
Verschiedene Aspekte der deutschen Standardsprache in Südtirol sind in den 
vergangenen Jahrzehnten in einer Vielzahl von Einzelstudien und Publikatio- 
nen untersucht und beschrieben worden. Doch hat sich nach einer Analyse der 
bisherigen Arbeiten und methodischen Ansätze, die im kommenden Abschnitt 
überblicksartig vorgestellt werden, eine Forschungslücke klar herauskristalli- 
siert (vgl. dazu auch Abel/Anstein/Ties 2008: 243 £.): Ein Desiderat bilden 
demnach groß angelegte, systematische Untersuchungen zu den Besonderhei- 
ten der deutschen Schriftsprache in Südtirol mithilfe neuer korpuslinguisti- 
scher Methoden, und zwar einerseits auf lexikalischer Ebene (Einzel- und 
Mehrwortebene) zur Untermauerung und Ergänzung bisheriger Forschungser- 
gebnisse. Andererseits sind systematische Studien auf syntagmatischer (u.a. 
Analyse rekurrenter Sprachmuster, Kollokationen) bis hin zur textuellen Ebene 
(u.a. Analyse der Textstruktur) notwendig, um Besonderheiten und Entwick- 
lungen zu erheben. 

Wichtig erscheint es, die Untersuchungen im intralingualen Vergleich, d.h. für 
Varietäten, durchzuführen. Auf ein solches Forschungsdesiderat wird auch an 
anderer Stelle hingewiesen, so etwa bei Ammon (2001: 25), der fordert, „durch 
konsequente Kontrastierung mit anderen deutschsprachigen Ländern die Süd- 
tiroler Spezifik der identifizierten Formen [d.h. der sprachlichen Besonderhei- 
ten] zu prüfen.“ Ein erster Schritt in diese Richtung wurde für die Allgemein- 
sprache durch das Variantenwörterbuch des Deutschen (Ammon et al. 2004) 
gesetzt, im Bereich der Rechtssprache etwa durch die Erarbeitung der Termi- 
nologischen Datenbank in distro. Umfassende sowie systematische Untersu- 
chungen auf höheren linguistischen Ebenen, für die digitale Ressourcen unab- 
dingbar sind, stehen bislang jedoch aus. 

Der vorliegende Beitrag ordnet sich in diesen Kontext ein, und seine Ziele, die 
im Wesentlichen auf zwei Ebenen anzusiedeln sind, leiten sich daraus ab: 

So geht es einmal darum, neue Methoden und Werkzeuge zur Untersuchung 
von Varietäten besonders auf lexikalischer und syntagmatischer Ebene vorzu- 
stellen und damit einen Beitrag zur Methodik in der Variationsforschung zu 
leisten. Die Verfahren und Instrumente werden in Pilotuntersuchungen an- 
hand eines kleinen Vergleichskorpus von Zeitungstexten eingesetzt und bei- 
des, korpuslinguistische Ansätze sowie Datengrundlage, auf ihre Brauchbar- 


2 <www.eurac.edu/bistro.htm> (Stand: Jänner 2011) 
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keit zur Ermittlung sprachlicher Besonderheiten des Südtiroler Deutschen hin 
analysiert. Zunächst stehen dabei besonders der Ansatz und das Vorgehen bei 
der Datenerhebung im Mittelpunkt des Interesses; das Ziel ist es, automati- 
siert eine Vorauswahl der Daten zu erstellen, die anschließend manuell genau- 
er zu untersuchen sind. Damit ist auch die Brücke zum zweiten Untersu- 
chungsschwerpunkt geschlagen, nämlich zur Erhebung und Beschreibung von 
möglichen Besonderheiten der deutschen Sprache in Südtirol anhand um- 
fangreicher authentischer Datensammlungen, die in Form von elektronischen 
Korpora vorliegen. Bisherige Ergebnisse in der Varietäten- und Sprachkon- 
taktforschung sollen, wo es möglich ist, untermauert und ergänzt oder revi- 
diert werden. Mit diesem empirischen Ansatz wird ein Beitrag zur Beschrei- 
bung der deutschen Sprache Südtirols geleistet. 


2. Untersuchungen zur geschriebenen deutschen 
Standardsprache in Südtirol 

Untersuchungsschwerpunkte der geschriebenen deutschen Allgemeinsprache 
in Südtirol bilden sprachliche Besonderheiten bzw. kontaktsprachliche Er- 
scheinungen besonders lexikalischer, aber auch morphologisch-syntaktischer 
Art. Die Anfänge der Auseinandersetzung mit den Besonderheiten der deut- 
schen Sprache in Südtirol gehen auf die 60er (z.B. Rizzo-Baur 1962) und 70er 
Jahre (z.B. Riedmann 1972) zurück. Riedmanns Thesen zum Sprachwandel, 
wie etwa zu den Einflüssen aus dem Italienischen und seine Kritik an sprach- 
lichen Interferenzen, wurden in den darauffolgenden Jahren übernommen (z.B. 
Kramer 1981, Tyroller 1986), gelten heute jedoch als weitgehend überholt. Die 
sprachwissenschaftliche Forschung konzentrierte sich weiterhin und im We- 
sentlichen bis heute auf die Ebene der Lexik (Ein- und Mehrwortebene) und 
der Grammatik (z.B. Pernstich 1984, Forer/Moser 1988, Lanthaler/Saxalber 
1995, Ammon 2001, Ammon et al. 2004; für einen Überblick vgl. Lanthaler 
1997), während es kaum Untersuchungen zu Erscheinungen auf syntagmati- 
scher (Kollokationen, idiomatische Wendungen; vgl. Abfalterer 2007: 54) und 
textueller Ebene (z.B. Riehl 2001; vgl. Spillner 1992: 180) gibt. Wenig unter- 
sucht sind außerdem kontaktsprachliche Erscheinungen in übersetzten Texten 
(z.B. Putzer 1984°)*. 

Während in den 60/70er und 80er Jahren vielfach „Kontaktphänomene als Be- 
einträchtigungen des Systems“ (Lanthaler 1995: 209) beschrieben wurden und 


3 Analyse übersetzter Texte von KandidatInnen der Zweisprachigkeitsprüfung auf verschiedenen sprachlichen 
Ebenen 


4 Auf Untersuchungen zur gesprochenen Sprache in Südtirol wird im Rahmen dieses Beitrags nicht eingegangen. 
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die Angst vor einem Sprachverfall vorherrschend war (s. z.B. Riedmann 1972), 
ging man spater von einer Interferenzforschung, die Interferenzen vorwiegend 
als Anzeichen für einen Verlust wertet, zur Beschreibung von Sonderwort- 
schätzen aus variationslinguistischer Sicht über (vgl. z.B. Egger 2001: 58, Ab- 
falterer 2007: 38, Moser 1990: 20-21). 

Die Interpretation bisheriger Forschungsergebnisse weist darauf hin, dass es 
neben nahe liegenden Übernahmen aus dem Italienischen besonders im Be- 
reich der Amts- und Verwaltungssprache weniger Auffälligkeiten gibt als an- 
genommen (vgl. z.B. Ammon 2001: 25, Pernstich 1984: 112, Masser 1982: 72- 
73). Dass ein Vorkommen von Italianismen in der deutschen Umgangs- und 
Hochsprache, v.a. auch in der gesprochenen Sprache, festzustellen ist, steht au- 
Ber Frage. 

Im Zuge der Diskussionen um das Deutsche in Südtirol kommt immer wieder 
die Frage nach gutem und korrektem Deutsch und in diesem Zusammenhang 
nach entsprechenden Norminstanzen auf (vgl. z.B. Lanthaler/Saxalber 1995, 
Ammon 2001, Daniel et al. 2001, Lanthaler 2001). Unsicherheiten in Bezug auf 
eine korrekte Sprachverwendung scheinen teilweise zu einem Sprachpurismus 
und zu einer Orientierung an der bundesdeutschen Norm sowie zu einer Ab- 
lehnung regionaler Eigenheiten zu führen, was u.a. auf die Bemühungen um 
den Erhalt der deutschen Hochsprache nach dem Faschismus zurückgeführt 
wird (vgl. Lanthaler 1995: 293£.). Dies bestätigen beispielsweise Analysen der 
Berichterstattung zum Thema ‚Sprache in Südtirol‘ in der auflagenstarken loka- 
len Tageszeitung ‚Dolomiten‘ (s. Abfalterer 2007: 37f£). Neben der wissen- 
schaftlichen Auseinandersetzung mit den Eigenheiten der deutschen Sprache in 
Südtirol spielen die „Alltagsrezeption‘ im Bereich Sprachkritik“ (vgl. Abfalterer 
2007: 37) und in diesem Zusammenhang die Printmedien eine nicht unbedeu- 
tende Rolle. Darüber hinaus sind auch Einzelphänomensammlungen von 
Sprachinteressierten zu beachten, die einer größeren Öffentlichkeit zur Verfü- 
gung gestellt werden (z.B. Daum’). 

Was die Erhebungsmethoden betrifft, so wurde und wird traditionellerweise 
mit Belegsammlungen und Exzerpten anhand ausgewählter Textsorten und 
Texte gearbeitet (z.B. Riedmann 1972, Pernstich 1984, Riehl 2001, Ammon et 
al. 2004, Abfalterer 2007), wobei anfänglich kaum der systematische intralin- 
guale Vergleich angestrebt wurde. Dieser hingegen rückte im Zuge der Ausar- 
beitung des Variantenwörterbuchs des Deutschen (Ammon et al. 2004) in den 
Mittelpunkt des Interesses. Daneben bediente man sich dabei einzelner Rück- 
fragen an Experten und Gewährspersonen und griff auf Wörterbücher und die 


5 <http://www.kulturinstitut.org/fileadmin/user_upload/teaserbilder/veranstaltungen/Sprachstelle/Suedtiro- 
lerBesonderheiten_ListeDaum.pdf> (Stand: Jänner 2011) 
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einschlägige Sekundärliteratur zurück (s. dazu z.B. Amonn et al. 2004, Abfal- 
terer 2007). Neuer hingegen ist der Einsatz des Internets als Quelle in der Va- 
riationslinguistik (s. dazu z.B. Bickel 2000), etwa bestimmter Internet-Such- 
maschinen zur Absicherung und zur Ergänzung herkömmlicher 
Belegsammlungen im Rahmen der Erarbeitung des Variantenwörterbuchs für 
das Deutsche (vgl. Bickel 2000: 74, 81, 111). Immer aussichtsreicher für die 
Variationsforschung wird der Einsatz korpuslinguistischer Methoden. So bil- 
det der so genannte C4-Verbund’, ein Zusammenschluss von Korpusinitiati- 
ven in Deutschland, Österreich, der Schweiz und Südtirol zur Erstellung eines 
deutschen Vergleichskorpus, eine vielversprechende Grundlage für quantitati- 
ve vertiefende Studien zu den Varietäten des Standarddeutschen auf verschie- 
denen sprachlichen Beschreibungsebenen. 


3. Datengrundlage, methodisches Vorgehen und 

erste Ergebnisse 

3.1. Datengrundlage 

Die ersten Vergleichsstudien wurden exemplarisch anhand von zwei Zeitungs- 
korpora durchgeführt (vergleichbar mit der Datengrundlage in Heid in diesem 
Band). Das Textkorpus ‚Dolomiten‘ (im Folgenden: DOLO) besteht aus rund 
66 Mio. Tokens’ der Südtiroler Tageszeitung ‚Dolomiten‘ aus den Jahren 1991 
bis 2006. Im Textkorpus ‚Frankfurter Rundschau‘ (im Folgenden: FR) sind 
rund 40 Mio. Tokens der überregionalen deutschen Tageszeitung ‚Frankfurter 
Rundschau‘ aus den Jahren 1992 und 1993 enthalten. Die linguistische Vor- 
verarbeitung beider Korpora umfasst Tokenisierung, Wortart-Annotation, 
Lemmatisierung und Chunking.® Sie wurde automatisch mit dem Tree Tagger? 
(Schmid 1994) und dem Chunker YAC (Kermes 2003) durchgeführt. Die In- 
dizierung!° und Abfrage erfolgte mit der CorpusWorkbench CWB und dem 
Corpus Query Processor CQP des IMS Stuttgart (Christ 1994, Evert 2005). 


6 <http://www.korpus-c4.org> (Stand: Jänner 2011) 


7 Als Token wird das „Vorkommen eines Wortes an einer bestimmten Stelle im Korpus“ bezeichnet (Lemnit- 
zer/Zinsmeister 2006: 198). 


8 Bei der ‚Tokenisierung‘ wird ein Fließtext in einzelne Einheiten unterteilt (Lemnitzer/Zinsmeister 2006: 
64), z.B. werden Wörter von direkt nachfolgenden Satzzeichen getrennt. Annotieren‘ bezeichnet das Hinzu- 
fügen zusätzlicher Informationen zu den Bestandteilen eines Textes (vgl. Lemnitzer/Zinsmeister 2006: 60- 
88,196). Beim ‚Lemmatisieren‘ werden die Grundformen (Lemmata) jeder einzelnen Wortform annotiert 
(Lemnitzer/Zinsmeister 2006: 71). ‚Chunking‘-Software fasst zusammengehörige Phrasen innerhalb eines 
Satzes zusammen; zu unterscheiden von Parsing, bei dem vollständige Syntaxanalysebäume erstellt werden 
(Lemnitzer/Zinsmeister 2006: 79,198). 


9 zur automatischen Annotation von Wortarten (statistisch) und Lemmata (lexikon-basiert) 


10  ‚Indizierung‘ bezieht sich hier auf die Formatierung der Daten für ein bestimmtes Abfragesystem. 
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Als weitere Ressourcen wurden Ergebnisse der Innsbrucker Forschungen zum 
Südtiroler Deutschen herangezogen, so die Beiträge zum Variantenwörterbuch 
des Deutschen (Ammon et al. 2004), die Sammlung von Südtirolismen (Ab- 
falterer 2007) und die CD-ROM ‚Datenbank zum Südtiroler Deutsch" Zu- 
dem wurden Spezialwortschatzlisten, z.B. Namenslisten der Provinz Bozen 
(Quelle: Landesinstitut für Statistik ASTAT”) oder Termlisten der distro-Da- 
tenbank®, verwendet. 

Für die Untersuchungen wurden ausschließlich Korpora der Textsorte, journa- 
listische Prosa‘ ausgewählt. Sie können daher nicht als repräsentativ für die 
deutschen Varietäten in Südtirol und Deutschland angesehen werden. Zudem 
ist die Datenmenge nicht ausreichend für allgemeingültige Aussagen. Die 
Korpora sind auch aus inhaltlicher Perspektive nicht direkt und ohne Vorbe- 
halte vergleichbar. Diese Einschränkungen schmälern jedoch keineswegs den 
Wert der Untersuchungen, die zunächst nicht auf Aspekte wie Repräsentativi- 
tät und Allgemeingültigkeit hin angelegt, sondern wie eingangs beschrieben 
auf anderen Ebenen angesiedelt sind. Demnach geht es in erster Linie darum, 
Ansätze und Instrumente bei der Datenerhebung und -bearbeitung zu präsen- 
tieren, die es ermöglichen, eine Vorauswahl von Daten als Anhaltspunkte für 
detailliertere, manuelle Untersuchungen zu treffen, sowie diese in Pilotunter- 
suchungen einzusetzen und Ergebnisse vorzustellen. 


3.2. Einzelstudien 
Die Frequenzerhebungen und vergleichenden Untersuchungen sprachlicher 
Einheiten und Muster gliedern sich in drei Teile'*: 
1) Frequenzerhebung Südtirolismen (Abfalterer 2007) [3.2.1], 
2) Untersuchung nicht automatisch lemmatisierter Wörter im DOLO- 
Korpus (im Folgenden: unknowns) [3.2.2], 
3) Extraktion von kontinuierlichen und diskontinuierlichen Kookkurrenzen: 
[3.2.3] 
a) systematisch: Adjektiv+Substantiv (im Folgenden: Adj+N), 
Substantiv+Prä-position+Substantiv (im Folgenden: N+Präp+N), 
b) exemplarisch: Substantiv+Verb (im Folgenden: N+V) (Objekt/ 
Subjekt+Prädikat). 


11 vom Südtiroler Kulturinstitut finanziertes Projekt, durchgeführt am Institut für deutsche Sprache, Literatur 
und Literaturkritik der Leopold-Franzens-Universität Innsbruck, 2002/2003 (Abfalterer, Moser) 


12 <http://www.provinz.bz.it/astat/de> (Stand: Jänner 2011) 


13 bistro: Informationssystem für Rechtsterminologie der EURAC <http://www.eurac.edu/bistro> (Stand: Jän- 
ner 2011) 


14 Ähnliche Untersuchungen zu Rechtstexten sind in Abel/Anstein/Ties (2008) beschrieben. 
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In den folgenden Abschnitten werden jeweils Methoden und Ergebnisse der 
drei Studien vorgestellt. 


3.2.1. Frequenzerhebung Südtirolismen 

In Anlehnung an Abfalterer (2007: 167ff) werden lexikalische Besonderheiten 
des Deutschen in Südtirol für die Untersuchung folgendermaßen unterschie- 
den: 

° Primäre Südtirolismen (ausschließlich in Südtirol verwendet): 

o Bestimmte Lemmata werden ausschließlich in Südtirol verwendet 
und sind in allen ihren Bedeutungen ein Südtirolismus, z.B. Auto- 
biichlein (im Folgenden: primS). 

o Bestimmte Lemmata weisen eine spezifische Eigenschaft aus- 
schließlich in Südtirol auf und sind nur in einer Sonderbedeutung 
ein Südtirolismus, z.B. Kondominium (Sonderbedeutung in Südtirol, 
abgekürzt STIR, im Unterschied zur Verwendung in anderen Zen- 
tren des plurizentrischen Deutschen: Österreich, Schweiz, Deutsch- 
land, Belgien Liechtenstein, Luxemburg, abgekürzt: A, CH, D, 
BELG, LIE, LUX) (im Folgenden: primS_SB). 

e Sekundäre Südtirolismen (in mindestens einem weiteren Zentrum ver- 
wendet): 

o Bestimmte Lemmata sind vollständig konform mit Lemmata in 
mindestens einem der großen deutschsprachigen Nachbarländer 
Südtirols, z.B. Marille (auch in A) (im Folgenden: sekS). 

In der vorliegenden Studie wurden Südtirolismen-Vorkommen (Quelle: Ab- 
falterer 2007: 168-179, 263-268) in den zwei Korpora mit Hilfe von CQP ge- 
zählt” und die entstandenen Frequenzlisten zunächst mit Perl-Skripten ge- 
genübergestellt (Abb. 1). Dabei war zu erwarten, dass primäre Südtirolismen 
ohne Sonderbedeutung (primS) in der FR nicht oder sehr selten vorkommen. 
Einzelne solcher primärer Südtirolismen mit Vorkommen in der FR sowie 
primäre Südtirolismen mit Sonderbedeutung (primS_SB) und sekundäre Süd- 
tirolismen (sekS) wurden mit größeren Satzkontexten genauer untersucht. 


15 Alle aufgeführten Zahlen bezeichnen absolute oder relative Häufigkeiten (Letztere in Bezug zur Gesamt- 
korpusgröße) von Vorkommen; statistische Vergleichsmethoden oder Assoziationsmaße wurden in dieser 
Pilotstudie nicht angewandt. Zudem können unterschiedliche Frequenzdaten auch von verschiedenen In- 
halten herrühren oder durch Zitate aus anderen Ländern ‚verfälscht‘ werden, weswegen eine manuelle Kon- 
textüberprüfung unabdingbar ist. ‚Triviale‘ Unterschiede wie in Heid in diesem Band beschrieben stellen 
eine weitere Gruppe dar, z.B. werden tatsächliche Gegebenheiten der betreffenden Länder offensichtlich 
durch besondere Lexik dargestellt. 
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er CQP/Perl 
prımS 


primS SB 
& CQP/Perl 
sekS i 


Abb. 1: Frequenzermittlung der Südtirolismen in den zwei Vergleichskorpora 


Tabelle 1 stellt einen Auszug aus der Beispielliste der primären Südtirolismen 
mit Vorkommen in der FR dar, die genauer zu betrachten sind. 


DOLO DOLO FR FR 
absolut relativ!9 absolut relativ'” 
in % in % 

Abgeordnetenkammer 801 0,00122 57 0,00142 
Schulamtsleiter 836 0,001 27 48 0,00119 
SVP 14566 0,00221 29 0,00721 
Regionalregierung 504 0,00766 25 0,00622 
Proporz 754 0,00115 21 0,00522 
Regionalrat 382 0,00581 8 0,00199 
Finanzpolizei 519 0,00789 7 0,00174 
Lyzeum 205 0,00312 6 0,00149 
Vertrauensarzt 59 0,00897 5 0,00124 
Industriellenverband 587 0,00892 4 0,00099 
Schriftleiter 42 0,00638 3 0,00075 
Sanitätseinheit 394 0,00599 3 0,00075 
Carabiniere 349 0,00531 3 0,00075 


Tab. 1: Auszug aus der Gegenüberstellung von Frequenzdaten zu primären Südtirolismen ohne 
Sonderbedeutung, sortiert nach Frequenz in der FR 


16 genaue Tokenanzahl DOLO: 65.782.016 
17 genaue Tokenanzahl FR: 40.201.367 
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Als ein erstes Beispiel aus der Gruppe der primären Südtirolismen soll hier 
exemplarisch das Lemma Adgeordnetenkammer genauer beleuchtet werden. 
Der Eintrag im Wörterbuchteil von Abfalterer (2007), der ähnlich auch im 
Variantenwörterbuch (Ammon et al. 2004) aussieht, ist in Beispiel (1) darge- 
stellt: 


(1) Abgeordnetenkammer die; -, -n <übersetzt aus ital. camera dei 
deputati; lat. camera>; primärer Südtirolismus; Bed.: ‚erste -> Kam- 
mer des italienischen Parlaments‘; Bsp.: Noch in diesem Monat wird 
die Abgeordnetenkammer in Rom die zweite Lesung des Gesetzes vor- 
nehmen (Dolomiten 16.10.2000, 3); Variation: in A und CH ->Na- 
tionalrat, in CH ->Kammer: *grosse Kammer, in D ->Bundestag, 
in LIE ->Landtag (Abfalterer 2007) 


Die Verwendungen im DOLO-Korpus bestätigen die Bedeutung aus (1), wie 
die folgenden Beispiele zeigen: 


oMit 163 gegen 106 Stimmen billigte der Senat ein neues An- 
ti-Mafia-Gesetz. Die Vorlage geht nun an die <Abgeordne- 
tenkammer>, die in der kommenden Woche abstimmen soll. 

oDie Neueinteilung der Senatswahlkreise - die in der römi- 
schen <Abgeordnetenkammer> vor wenigen Tagen neuerlich 
auf unbestimmte Zeit vertagt wurde - [...] 

oDie <Abgeordnetenkammer> hat gestern das von der Regierung 
erlassene Dekret gegen die Wiederverwendung von Schmutz- 
geldern gutgeheißen. 

Zur Kontrolle wurden die Vorkommen in der FR betrachtet, 
mit dem Schluss, dass sich alle Belegsätze auf Gegeben- 
heiten, in diesem Fall Parlamente, anderer Länder bezie- 
hen. Die Begriffe werden als ‚Zitate‘ verwendet, so z.B.: 

oMit großer Mehrheit hat die italienische <Abgeordnetenkam- 
mer> in Rom das von der Regierung vorgelegte Gesetzespa- 
ket zur [...] 

oDie <Abgeordnetenkammer> des Schweizer Parlaments hat am 
Mittwoch mit großer Mehrheit für den Vertrag zur Schaf- 
fung eines Europäischen Wirtschaftsraums (EWR) gestimmt. 

oMit großer Mehrheit hat die belgische <Abgeordnetenkammer> 
am Wochenende dem Vertrag von Maastricht für eine Euro- 


päische Union mit gemeinsamer Währung zugestimmt. 
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Als ein weiteres Beispiel wird ein Lemma untersucht, das nur in einer Sonder- 
bedeutung ein Südtirolismus ist, u.z. das Lemma Konsortium. In diesem Fall 
muss in der Korpusarbeit der jeweilige Kontext genau betrachtet werden, da — 
aufgrund der identischen Wortform — nicht automatisch klar ist, dass semanti- 
sche Unterschiede bestehen. 

Ein Konsortium ist nach Abfalterer (2007) in Beispiel (2) in der Südtiroler 
Sonderbedeutung eine dauerhafte Gemeinschaft, beschränkt auf die öffentli- 
che Verwaltung und Landwirtschaft, im Gegensatz zu einem vorübergehen- 
den Zusammenschluss wie in der gemeindeutschen Bedeutung nach (3): 


(2) Konsortium das; -s, ...ien; <aus ital. consorzio; lat. consortium ‚Teil- 
nahme‘>; primärer Südtirolismus in der Sonderbed.: ‚dauerhafte Ar- 
beits- und Interessengemeinschaft in der öffentlichen Verwaltung 
oder in der Landwirtschaft‘; Bsp.: Die einheitliche Verwaltung des 
Parks soll durch ein Konsortium zwischen dem Staat... und den Autono- 
men Provinzen Bozen und Trient erfolgen (Südtirols Autonomie, 226) 
— Die Bedeutung ‚vorübergehender Zusammenschluss von Unter- 
nehmen, z.B. Banken‘ ist gemeindt. [...] (Abfalterer 2007) 


(3) Konsortium [...] (Wirtsch.): vorübergehender Zusammenschluss 
von Unternehmen, bes. Banken, zur gemeinsamen Durchführung ei- 
nes größeren Geschäfts: ein internationales K. von elf Großbanken; 
ein K. bilden, gründen (Duden Universalwörterbuch 2001) 


Die Südtiroler Sonderbedeutung mit den semantischen Merkmalen nach (2) 
bestätigen viele Beispiele aus der DOLO, so z.B.: 


oDer Verkehrsverbund - VVB - ist ein <Konsortium> zwischen 
den Gemeinden Bozen, Meran und Leifers und führt den öf- 
fentlichen Personentransport durch [...] 

oSie würden sich bereit erklären, die Anpassung des Pacht- 
zinses zu akzeptieren. Dann jedoch müßte das <Konsorti- 
um>, so die Bauern, die Meliorierung und Kultivierung des 
Grundes entsprechend entschädigen [...] 

o [..] ein Agrar- und Lebensmittelgeschäft gegründet. 1956 
wurde die Niederlassung, die bei den Bauern besser als 


„<Konsortium>“ bekannt [...] 


Weitere Belege aus der DOLO zeigen aber auch, dass dem Konsortium in 
Südtirol eine weiter gefasste Bedeutung zukommt: 
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oZwei afrikanische Köchinnen werden ein leckeres Abendessen 
zubereiten. Die Südtiroler Weltläden sowie das <Konsorti- 
um> „CTM Altromercato“ werden sich und ihre Produkte vor- 
stellen [...] 

oGrund dafür war vor allem die Rechtsform <Konsortium>: Sie 
erschien den Mitgliedern nicht mehr zeitgemäß, da damit 
vor allem in steuerrechtlicher Hinsicht hohe Kosten ver- 


bunden waren [...] 


Als Lehnwort'® aus dem Italienischen scheint das Konsortium alle wesentli- 
chen Merkmale der Originalsprache zu übernehmen, wie der Wörterbuchein- 
trag” (4) zeigt 


(4) con|sör|zio, s.m. [...] 
2 TS econ., fin., associazione di più soggetti, costituita per coordina- 
re e regolamentare le attività comuni, spec. economiche o finanziarie: 
c. di piccole e medie imprese, c. industriale, provinciale, c. tra produt- 
tori vinicoli [...] Polirematiche: consorzio agrario loc.s.m. [...] 


Ausgehend von diesen Belegen und Untersuchungen kann die Beschreibung 
der Südtiroler Sonderbedeutung in den erwähnten Quellen ergänzt bzw. prä- 
zisiert werden: Konsortium ist demnach ein Lehnwort aus dem Italienischen 
mit den Merkmalen ‚Verbund/Zusammenschluss‘, ‚privat/öffentlich‘, zur ‚Ko- 
ordination/Befriedigung gemeinsamer (besonders wirtschaftlich-finanzieller) 
Interessen‘, wobei die zeitliche Dauer unwesentlich ist und keine Beschrän- 
kung auf Bereiche wie öffentliche Verwaltung oder Landwirtschaft besteht. 


In einer zusätzlichen ähnlichen Studie im Rahmen der Arbeiten an Vis-4- 
Vis” (s. auch Anstein 2009), einem System zum Vergleich von Varietäten an- 
hand von Korpora, wurden Wortlisten der beiden Korpora erstellt und nach 
Frequenzen sortiert. Tabelle 2 zeigt einige Beispiele mit hoher Frequenz in der 
DOLO und geringerer Frequenz in der FR. 


18 nach der Terminologie Beltz (1974), auch in Abfalterer (2007:155): Lehnwörter = Übernahmen aus dem 
Ital. <(aus) ital.>; Lehnbildungen = Übersetzungen < übersetzt aus ital.> 


19 Online-Version des italienischen Wörterbuchs De Mauro — Paravia: <http://www.demauroparavia.it/26415> 
(Stand: März 2008; 2011: geänderte Zugriffsmodalitäten) 


20 <http://www.korpus-suedtirol.it/korpus-suedtirol_II_de.htm> (Stand: Jänner 2011) 
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DOLO uu ER ir 
absolut in% absolut in% 
hingegen 12782 0,001943 2358 0,00587 
Rang 10940 0,001663 2876 0,00715 
Start 10891 0,001656 2432 0,00605 
Vorjahr 10620 0,001614 1813 0,00451 
Sprache 9838 0,001496 3003 0,00747 
organisieren 9724 0,001478 3569 0,00888 
Bauer 9478 0,001441 2518 0,00626 
erzielen 9400 0,001429 2853 0,00710 
erfolgen 9296 0,001413 1808 0,00450 
Direktor 9272 0,001410 1239 0,00308 
betreffen 9157 0,001392 3079 0,00766 
Kreuz 9101 0,001384 1970 0,00490 
Beitrag 9099 0,001383 3125 0,00777 
Lauf 8336 0,001267 2284 0,00568 
somit 8241 0,001253 1762 0,00438 
morgig 7847 0,001193 785 0,00195 
gestrig 7839 0,001192 484 0,00120 
Leitung 7769 0,001181 2664 0,00663 
zufrieden 7601 0,001155 2912 0,00724 
Wettbewerb 7512 0,001142 2361 0,00587 
Papst 7463 0,001135 471 0,00117 
(sich) klassieren 513 0,007798 10 0,00249 


Tab. 2: Auszug aus der Gegenüberstellung von Wortlisten der beiden Vergleichskorpora, 
sortiert nach Frequenz in der DOLO 


Solche Hoch- vs. Niedrigfrequenz-Gegenüberstellungen können Hinweise auf 
bisher nicht erfasste lexikalische Besonderheiten liefern. Für Phänomene, die 
eine jeweils unverhältnismäßig hohe bzw. niedrige Frequenz in den Vergleichs- 
korpora aufweisen, kann in Detailkontextstudien das Vorhandensein von Son- 
derbedeutungen überprüft werden. 


3.2.2. Untersuchung der unknowns 

In der zweiten Teilstudie wurde die beim Lemmatisieren mit dem Tree Tagger 
entstandene unknowns-Liste aus der DOLO mit ca. 832000 Types als eine 
Quelle für neue Südtirolismen oder anderen Spezialwortschatz genauer be- 
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trachtet. Für die in die Liste aufgenommenen Wörter wurde in dem für das 
Bundesdeutsche entwickelten Tagger (Schmid 1994) kein Lexikoneintrag 
gefunden, was auf möglicherweise südtirolspezifischen Wortschatz schließen 
lässt. Nach dem mithilfe von Perl-Skripten automatischen Filtern der 
unknowns-Liste mit bestehenden Spezialwortschatzlisten (bekannte Varianten, 
Namen, etc.; siehe zu den Quellen auch Abschnitt 3.1) ergibt sich eine Wort- 
liste für neue Kandidaten, die manuell auszuwerten ist. Die Filterlisten können 
jeweils semiautomatisch mit den neuen Kandidaten vervollständigt werden 


(zum Ablauf s. Abb. 2). 


neue ‚Kandidaten 


5000 


0000 


Abb. 2: Ablauf der unknowns-Studie 


Tabelle 3 zeigt einen Auszug aus der sich ergebenden Liste der unknowns. 
Einheiten, die keine automatische Klassifikation erhielten, sind mit einer lee- 
ren eckigen Klammer gekennzeichnet. Diese wurden manuell in vorgegebene 
Klassen eingeteilt und ggf. lemmatisiert, um sie für weiteren Gebrauch mit 
mehr Information anzureichern. 
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Frequenz automatische manuelle ggf. 
DOLO Klassifizierung Lemma 
absolut Klassifizierung 

Tschengls 447 Il Ortsname deutsch 

Bressanone |122 Il Ortsname italienisch 

Mayr 7094 0] Nachname 

SVP 14566 0] Parteiname Abkiirzung 

Zett 3600 0] Produktname Zeitung 

Vinschgaus | 596 0 Flurname Vinschgau 

weiters 2778 [Austriazismus] auch STIR 

ober, 231 [Austriazismus] auch STIR 

Stadel 624 [Austriazismus] auch STIR 

ehestens 123 0] Südtirolismus 


Tab. 3: Südtirolismenkandidaten aus den unknowns 


Die als Austriazismen geltenden lexikalischen Einheiten weiters, ober als Prä- 
position und Stadel sowie das Adverb ehestens sind neue Kandidaten für Süd- 
tirolismen: Für weiters mit 2778 Belegen in der DOLO, ober mit 231 und 
Stadel mit 624, die im Variantenwörterbuch bei Ammon et al. (2004) nicht 
den Zusatz STIR aufweisen (s. dort: weiters: A, LIE, Adv.: [...]; ober: A, Präp. 
mit Dat. [...]; Stadel: A, CH-ost, D-südost) und bei Abfalterer (2007) als 
Einträge gänzlich fehlen, sowie für ehestens mit 123 Belegen in der DOLO 
in der Bedeutung baldmöglichst, das in beiden Wörterbüchern (Ammon et al. 
2004 und Abfalterer 2007) nicht erwähnt ist, können so entsprechende Ergän- 
zungen für eventuelle Neuauflagen vorgeschlagen werden. Die folgenden Wör- 
terbuch- und Korpusbelege helfen, die genannten Beispiele zu veranschau- 
lichen. 


(5) weiters A LIE Adv.: > WEITER CH D »>ferner, weiterhin, außer- 
dem«: [...] - Vgl. durchwegs, öfters (Variantenwörterbuch 2004) 

(6) weiters <Adv.> (österr.): weiterhin (3) (Duden Universalwörterbuch 2001) 

o<Weiters> genehmigte der Rat die Veräußerung eines Gemein- 


degrundstückes von rund 500 Quadratmetern. (DOLO) 
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(7) ober A Präp. mit Dat.: > OB CH >oberhalb von; ùber<: [...] - In 
D (landsch.) veraltet (Variantenwörterbuch 2004; kein Eintrag im 
Duden Universalwörterbuch 2001) 

oÜber die Mauerrisse sind Rauchgase direkt in die Kammer 
<ober> der Stube gedrungen, in der H. lag. (DOLO) 

(8) Stadel A CH-ost D-südost der; -s, -n: > SCHEUNE A-west CH 
D-nord/mittel, > SCHOBER A-west CH D-mittelost/südwest, 
> SCHEUER D-südwest >Teil des Bauernhauses oder freistehen- 
des Gebäude, in dem Heu und Stroh, oft auch Gerätschaften, auf- 
bewahrt werden<: [...] - Dazu: Heustadel, Holzstadel (Varianten- 
wörterbuch 2004) 

(9) Stadel, der; -s, - u. (schweiz.:) Städel, (österr. auch:) Stadeln [...] 
(süddt., österr., schweiz.): Heustadel (Duden Universalwörterbuch 
2001) 

(10) Heustadel, der (südd., österr., schweiz.): Scheune zum Aufbewahren 
von Heu (Duden Universalwörterbuch 2001) 

oDie Lüsener Feuerwehr konnte weitere Brandherde im <Stadel> 
und in der Sennhütte vor Ausbruch des Feuers entschär- 
fen. (DOLO) 

(11) ehestens <Adv.>: 1. frühestens: e. [am] Dienstag [...] 2. (österr., sonst 
veraltet) baldmöglichst; so schnell, bald wie möglich (Duden Universal- 
wörterbuch 2001) 

oEbenso müßte die Säuberung der Straßen vom Streusand <ehes- 
tens> vorgenommen werden. (DOLO) 

oIm Wohnbausektor will die Verwaltung die Erweiterungszone 


„Gebach“ <ehestens> verwirklichen. (DOLO) 


Zur weiteren Erleichterung der manuellen Feinarbeit sollten künftig bereits 
bekannte und erfasste Südtirolismen in eine morphologische Analysekompo- 
nente eingebaut werden, um Kompositabildungen mit einem Südtirolismus als 
Bestandteil mithilfe computerlinguistischer Werkzeuge zu zerlegen. So kön- 
nen unknowns-Einträge der Art Vizequdstor oder Ökonomatskasse, bei denen 
jeweils nur die Konstituenten Qudstor und Okonomat Südtirolismen sind, auto- 
matisch herausgefiltert werden. 
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3.2.3. Extraktion von kontinuierlichen und diskontinuierlichen Kookkurrenzen 
In der letzten der drei Teilstudien werden Ausführungen und Ergebnisse vor- 
gestellt, in denen Listen kontinuierlicher und diskontinuierlicher Kookkurren- 
zen aus beiden Korpora mithilfe von CQP und Perl nach bestimmten Mus- 
tern von Wortarten extrahiert und nach Häufigkeit sortiert wurden (s. Abb. 3). 
Als ‚Kookkurrenz‘ wird hier das gemeinsame Auftreten zweier lexikalischer 
Einheiten bezeichnet; ‚kontinuierlich‘ beschreibt Elemente, die direkt aufei- 
nander folgen, ‚diskontinuierlich‘ dagegen solche, die innerhalb eines Satzes 
vorkommen und durch funktionale Relationen, z.B. Subjekt-Prädikat, verbun- 
den sind (s. dazu auch Abel/Anstein/Ties 2008). 

Kontinuierliche Kookkurrenzen wie Adj+N oder N+Präp+N wurden systema- 
tisch behandelt, syntaktische Relationen wie Objekt/Subjekt+Prädikat exemp- 
larisch, da bei Letzteren mit den bisherigen Methoden keine systematischen 
Unterschiede zwischen den zwei Korpora festgestellt werden konnten. Für 
N-V-Kookkurrenzen decken die Anfragen verschiedene Satzmuster 
(Verbzweit- und Verbletztsätze) sowie verschiedene Tempora (zusammenge- 
setzte und einfache) ab; mehrere CQP-Anfragen führen also zu einer Kook- 
kurrenzliste pro Muster. Die Ergebnisse aus den zwei Korpora wurden vergli- 
chen, um auch hier durch die genauere Untersuchung von seltenen Fällen in 
der FR Besonderheiten des Südtiroler Deutschen aufzudecken. 


B 


boch- vs. niedrigfrequent (Perl) 


DOLO 

Cop, 1000 
u 100 
10 


Abb. 3: Arbeitsablauf der Kookkurrenzstudie 
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Für Adj+N- sowie (N+)Präp+N-Kookkurrenzen werden im Folgenden ver- 
schiedene Kontextbeispiele aufgeführt: 


a) allgemein(e) Klasse (DOLO: 522 vs. FR: 0) 

oAuf dem Programm stehen insgesamt sechs Läufe in den Al- 
tersklassen Jugend (U-17), Junioren (U-19) und <allgemei- 
ne Klasse> (jeweils Männer und Frauen). (DOLO) 

oEs wird dabei in zwei Kategorien gespielt: <allgemeine 
Klasse> und Altherren. (DOLO) 


Die allgemeine Klasse, die in der DOLO im Zusammenhang mit verschiede- 
nen Sportarten vorkommt und diese Gruppe von anderen, wie z.B. Jugendli- 
chen‘ oder ‚Altherren‘, unterscheidet, wird in der FR in vergleichbaren Kon- 
texten nicht verwendet. 


b) weiß(er) Stimmzettel (DOLO: 81 vs. FR: 2) 

oMit unserem Programm wollen wir auch jene ansprechen, die 
das letzte Mal einen <weißen Stimmzettel> abgegeben ha- 
ben, weil sie sich von keiner Partei angesprochen fühl- 
ten, [..] (DOLO) 

oDanach folgen auf den <weißen Stimmzetteln> für die Wahl 
der Gemeindeparlamente und den gelben für die Ortsbeiräte 


die örtlichen Wàhlergemeinschaften [..] (FR) 


In Südtirol bezeichnet ein weißer Stimmzettel einen nicht ausgefüllten, in 
Übereinstimmung mit der italienischen Bezeichnung scheda bianca, wohinge- 
gen sich das Adjektiv in Deutschland auf die Farbe des Papiers bezicht. 


c) innerhalb <Monat>/<Wochentag> (DOLO: 420 vs. FR: 0) 

o<Innerhalb März> können die Fragebögen [..] abgeholt und 
ausgefüllt wieder abgegeben werden. (DOLO) 

oWer sich nicht <innerhalb Freitag> die Gutschrift ausstellen 
lässt, verliert jeden Anspruch auf etwaige Geldrückgabe [...] 
(DOLO) 


Auch die Verwendung von innerhalb mit Zeitpunkten (d.h. Angabe von Wo- 
chentagen, Monaten, Uhrzeiten) in Südtirol anstelle von dis ist durch das itali- 
enische entro motiviert. Gemeindeutsch wird innerhalb hingegen im Zusam- 
menhang mit Zeiträumen (inkl. Fristen bestimmten Ausmaßes) verwendet, 
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wie der Worterbucheintrag (12) zeigt und was sich darüber hinaus auch im 
umfangreichen Korpus des DWDS?! bestätigen lässt. 

(12) innerhalb [...] I. <Präp. Mit Gen.> a) in einem bestimmten unbe- 
grenzten Raum; im Inneren, im Bereich [...]; b) in einem be- 
stimmten Zeitraum, im Verlauf von, während, binnen: i. der Ferien; 
i. einer Woche; <mit Dativ, wenn der Genitiv formal nicht zu er- 
kennen ist:> i. fünf Monaten. II. <Adv. In Verbindung mit „von“> a) 
im Inneren, im Bereich: i. von Berlin [...]; b) im Verlauf von, wäh- 
rend, binnen: i. von drei Jahren (Duden Universalwörterbuch 2001) 


d) Achtung auf (N) (DOLO: 11 vs. FR: 0) 

oMan findet sie oft auf Mineralienbörsen billig zum Kauf an- 
geboten (<Achtung auf> Nachahmungen. (DOLO) 

oFolgende Dokumente sind für die Ausstellung eines Passes 
nötig: Zwei Fotos ([..] Gesicht muss gut sichtbar sein - 


<Achtung auf> Stirnfransen!), [..] (DOLO) 


Der Gebrauch der Präposition auf nach Achtung scheint ebenfalls durch die 
Kombination azfenzione a im Italienischen begründet zu sein. Gemeindeutsch 
wird Achtung nur in der Bedeutung von Hoch-/Wertschätzung mit einer Präposi- 
tion wie in (13) verwendet. Beispiele im DWDS-Korpus zusätzlich zur FR be- 
legen dies ebenfalls und zeigen zudem, dass Achtung (im Zeitraum 1970-2000) 
in keinem der Fälle mit der Priposition auf, sondern vorwiegend mit vor, ge- 
folgt von für und gegenüber verwendet wird. 


(13) Achtung, die; - [...]: 1. Hoch-, Wertschätzung, Respekt: [...] vor 
jmdm., etw. A. haben; aus A. vor seinen Eltern [...]; 2. Als Ruf od. 
Aufschrift, um zur Vorsicht oder Aufmerksamkeit zu mahnen: A.!; 
A., Stufe!; A., Hochspannung!; A., Aufnahmel; 3. [...] (Duden 
Universalwörterbuch) 


e) (erst) in einem zweiten Moment (DOLO: 47 vs. FR: 0) 

oUnklar ist, ob die „Europasteuer“ ins Finanzgesetz für 1997 
aufgenommen wird oder <erst in einem zweiten Moment> 
greift. (DOLO) 


21 Korpus des DWDS (Digitales Wörterbuch der Deutschen Sprache): <http://www.dwds.de> (Stand: Jänner 
2011) 
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oWorin die Gegenleistung besteht, legen wir aber <erst in 
einem zweiten Moment> mit Durchführungsverordnung fest, 
[..] (DOLO) 

Das Vorkommen der Wendung in einem zweiten Moment in der 
DOLO, vergleichbar etwa mit gemeindeutsch zu einem spä- 
teren Zeitpunkt (so belegt in der FR und z.B. auch im 
DWDS-Korpus), scheint ebenfalls durch Interferenz aus 
dem Italienischen (in un secondo momento) erklärbar zu 


sein. 


Zuletzt wurden einige Detailstudien zu einzelnen auffälligen N+V-Kookkur- 
renzen durchgeführt, die einer weiteren systematischen Untersuchung bedür- 
fen, u.a. zum Fixiertheitsgrad, zur möglichen Anfälligkeit bestimmter morpho- 
syntaktischer Merkmale für Veränderungen, etc. Da die Phänomene in den 
beiden untersuchten Korpora sehr wenige Belege aufweisen, kann es sich um 
Zufallsfunde bzw. Tippfehler und möglicherweise nicht um südtirolspezifische 
Eigenheiten handeln. Zur Absicherung sind zusätzliche Analysen anhand grö- 
ßerer Datenmengen und weiterer Quellen nötig. 

Zwei Fälle sollen im Folgenden exemplarisch beleuchtet werden: 


f) Geschäft machen 
oEines haben sie gemeinsam. Sie wollen ihren Umsatz stei- 


gern, ganz einfach <Geschäft machen>. (DOLO) 


o [..] daß die Presse mit zwei Männern <Geschäfte macht> , von 
denen der eine [..] (FR) 

oWir hatten das Gefühl , mit den Behinderten soll nur ein 
<Geschäft gemacht> werden [..] (FR) 


Auffallend ist der Beleg Geschäft machen in der DOLO, da man gemein- 
deutsch die Kombination Geschäft (Sg.) + machen, in der Geschäft die Bedeu- 
tung Profit/Gewinn trägt, vorwiegend in Verbindung mit einem vorangehen- 
den Artikelwort (der, ein, kein, mein) (mit eventuell dazwischen stehenden 
Attributen) findet. Ansonsten ist die Form Geschäfte (PL) + machen üblich, wo- 
bei Geschäft im Sinne von auf Gewinn abzielende Unternehmung verwendet 
wird. Dafür sprechen neben dem Wörterbucheintrag in (14) auch eine Viel- 
zahl von Belegen nicht nur in der FR, sondern auch in der Kookkurrenzdaten- 
bank des IDS sowie im Korpus und in den Wortprofilen des DWDS”. 

22 Kookkurrenzdatenbank des IDS: <http://corpora.ids-mannheim.de/ccdb> (Stand: Jänner 2011); 


Korpus und Wortprofile des DWDS: <http://www.dwds.de> und <http://odo.dwds.de/wortprofil> (Stand: 
Jänner 2011; Letzteres mit passwortgeschütztem Zugang) 
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(14) Geschäft, das; -[e]s, -e [...]: 1.a) auf Gewinn abzielende [kaufman- 
nische] Unternehmung, [kaufmännische] Transaktion; Handel: die 
-e gehen gut; [...] mit jmdm. —e machen [...]; b) <o. Pl.> die kauf- 
männische Transaktionen; Verkauf, Absatz [...]; c) <o. PL> Gewinn 
[aus einer kaufmännischen Unternehmung], Profit: diese Unter- 
nehmung war für uns [klein G [...]; ein G. wittern; [...] er hat da- 
mit ein [glänzendes] G. gemacht ([sehr] viel damit verdient); [...] 
(Duden Universalwörterbuch 2001) 


g) Leistung bringen 
olc ehe einma avon aus, a le Torleute eine <reife 
h geh i Ld daß di 1 i LE 


Leistung bringen>. (DOLO) 


Im Beispiel eine reife Leistung bringen in der DOLO, das so weder in der FR 
noch in anderen Korpora wie dem DWDS-Korpus, der Kookkurrenzdaten- 
bank des IDS oder im Worterbucheintrag (15) vorzufinden ist, scheinen ver- 
schiedene feste Wendungen, namlich reif + Leistung und Leistung + bringen, 
vermischt worden zu sein. Vertiefende Analysen der Belege in der IDS-Da- 
tenbank zeigen, dass reif + Leistung einerseits allein stehend vielfach als Ausruf 
oder in Verbindung mit dem Verb sein als Pridikatsnomen vorkommt sowie 
andererseits als direktes Objekt besonders haufig in Verbindung mit dem Verb 
zeigen, daneben auch mit bieten, vorweisen etc. (nicht mit dringen) verwendet 
wird. 


(15) Leistung, die; -, -en [...]: 1. <o. Pl.> das Leisten (1). 2. a) erw. Geleis- 
tetes; geleistete körperliche, geistige Arbeit; unternommene Anstrengung 
u. das erzielte Ergebnis: eine hervorragende, gute, schlechte, mangel- 
hafte, schwache L.[...]; L. bringen (ugs.; etw. leisten) [...]; reife L.! 
(ugs.; großartig!) [...] (Duden Universalwörterbuch 2001) 


4. Fazit und Ausblick 

Die vorgestellten Studien geben Hinweise darauf, dass mit dem für die Varie- 
tätenuntersuchungen gewählten semiautomatischen Ansatz in kürzerer Zeit 
größere Datenmengen bewältigt werden können, als dies rein manuell möglich 
ist. Die mithilfe computerlinguistischer Werkzeuge geleistete Vorauswahl der 
Daten erlaubt es Linguisten, Lexikographen oder anderen Sprachexperten, 
sich bei der manuell zu leistenden Arbeit vorwiegend auf die linguistische 
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Feinarbeit zu konzentrieren, z.B. auf semantische und morpho-syntaktische 
Detailuntersuchungen von Einzellexemen oder Kookkurrenzen. 

Die beispielhaft vorgestellten Detailstudien konnten bisherige Beschreibungen 
von Südtiroler Besonderheiten sowohl untermauern als auch ergänzen. Zu- 
gleich lieferten sie wichtige Anhaltspunkte für die nächsten Arbeitsschritte, 
die im quantitativen und qualitativen Ausbau der Korpora, in der Verbesse- 
rung der Qualität der Datenauszeichnung und der spezifischen Weiterent- 
wicklung von Werkzeugen einerseits, sowie in der Konzentration der linguisti- 
schen Untersuchung auf bestimmte Phänomene andererseits liegen. 

Dazu werden die Datengrundlagen weiter angereichert, wodurch ihre Ver- 
gleichbarkeit zusätzlich erhöht wird. Zudem ermöglicht der Ausbau der be- 
reits vorhandenen Daten zu einem Südtirol-Referenzkorpus im Rahmen der 
C4-Initiative Vergleiche mit österreichischen und Schweizer Korpora. 

Die Instrumente zum automatisierten Varietätenvergleich anhand von Korpo- 
ra werden weiterentwickelt und in einem komplexen, aber einfach zu bedie- 
nenden System namens Vis-A-Vis zusammengefasst. Auch die Annotations- 
werkzeuge werden angepasst, denn die Qualität der Ergebnisse von 
automatisiertem Korpusvergleich hängt doch wesentlich von der Qualität der 
linguistischen Annotation ab. Da Werkzeuge meist für die ‚Hauptvarietäten‘ 
entwickelt wurden, sind besonders Abweichungen anfällig für Auszeichnungs- 
fehler. 

Die quantitativen und qualitativen Phänomenuntersuchungen auch im Ver- 
gleich mit anderen Varietätenkorpora werden fortgeführt, zunächst u.a. zu 
folgenden Schwerpunkten: 

o Südtirolismen und deren Kollokatoren, 

o  Systematisierung und Aufarbeitung vorhandener Studien und Phä- 
nomensammlungen (z.B. unbearbeitete Einträge der ‚Datenbank 
zum Südtiroler Deutsch‘ (Dialektwörter, Einzelfunde, Phraseologis- 
men, Komposita, Eigennamen, etc.), 

o synthetische vs. analytische Konstruktionen (z.B. -ministerium vs. Ministe- 
rium für ...), 

o  Kollokationen/Phraseologismen (z.B. Fixiertheitsgrad, lexikalische 
und morpho-syntaktische Besonderheiten, etc.), 

o Ursachenklarung (z.B. Kontaktphanomene, Sprachwandel). 

In einem weiteren Schritt können die Erkenntnisse über Varietäten wiederum 
für eine korrektere Annotation von Korpora und die Anpassung von Annota- 
tionswerkzeugen verwendet werden. So werden zunehmend bessere Grundla- 
gen für weitere Korpus(vergleichs)studien geschaffen, die eine wichtige Vor- 
aussetzung z.B. für die lexikographische Arbeit darstellen. 
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Die Ergebnisse der korpuslinguistischen Arbeit in Südtirol kommen zudem 
nicht nur der sprachwissenschaftlichen und computerlinguistischen Forschung 
zugute, sondern können zusätzlich sowohl im Bereich der Lehrerausbildung 
als auch der Sprachdidaktik eingesetzt und darüber hinaus als wichtige 
Grundlage für bildungspolitische Entscheidungen genutzt werden. 
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Abstract 

Didaktische Erprobungen von Korpusinstrumenten in den drei Schulsprachen Südti- 
rols, Deutsch, Englisch und Italienisch werden vor dem Hintergrund der weithin unge- 
lösten Probleme des Zweit- und Fremdspracherwerbs in gesteuerten Lernsituationen 
diskutiert. Ständige Bezugspunkte sind die in der internationalen Literatur kontrovers 
diskutierten Begriffe wie Muttersprachkompetenz, native-like selection, Idiomatizität, 
Fossilisierung in sprachlichen Bereichen von Phraseologismen, Kollokationen und In- 
terjektionen. Fallstudien von Korpusrecherchen in den Arbeitsbereichen Editing und 
Sprachenlernen in unterschiedlichen Lernsituationen für Anfänger und für Fortge- 
schrittene werden in Bezug zu theoretischen Einblicken in den kognitiven Hinter- 
grund von Sprachgebrauch und Spracherwerb diskutiert. Ausgehend vom Competition 
Model wird ein Erklärungsmodell für das bisher ungenügend untersuchte Phänomen 


der Stabilisierungsprozesse beim Spracherwerb zur Diskussion stellt. 


1. Sprache als Erleben von Heimat und Fremde 

„An der Spitze aller Kultur steht ein geistiges Wunder“ — schreibt Jacob 
Burckhardt in seinen „Weltgeschichtlichen Betrachtungen“ — „ein geistiges 
Wunder: die Sprachen, deren Ursprung, unabhängig vom Einzelvolke und sei- 
ner Einzelsprache, in der Seele liegt. (...) Eigentlich genügt zum Beweise 
schon das Erlernenkönnen fremder Sprachen überhaupt bis zum geistigen 
Gebrauch. So viele Sprachen, so viele Herzen besitzt man.“ (Vgl. die ¢ria corda 
des Ennius)! 

Wir können richtig nachvollziehen, wie das karge Zitat, das Ennius in indi- 
rekter Rede zu Wort kommen lässt — Quintus Ennius tria corda habere sese dice- 
bat, quod logui Graece et Osce et Latine sciret —, bei Burckhardt Früchte getragen 
hat. Und wer wollte Burckhardt widersprechen, dass Sprachen und Sprechen 
etwas mit dem Herzen der Menschen zu tun haben, mit den geistigen und 
emotionellen Kräften, die den Menschen als Gattung und als Individuum 
kennzeichnen? Wenn wir den Enthusiasmus in Burckhardts Worten zu den 
wissenschaftlichen Erkenntnissen zu Kognition und Emotion in Bezug setzen, 
zu neuen Erkenntnissen wie der Rolle der Amygdala, den vielfachen Verbin- 


1 Jacob Burckhardt, Weltgeschichtliche Betrachtungen, 2. Kapitel: Von den drei Potenzen, 3. Die Kultur, Stuttgart, o. 
J. 8. 55, 
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dungen, die vom Präfrontalen Cortex (Damasio 1994), dem Sitz der höheren 
kognitiven Fähigkeiten zu den motorischen Zentren und weit „hinunter“ bis 
in die ältesten Schichten des Gehirns führen, wo Unbewusstes und durch 
Emotionen Gesteuertes ihren Ort haben (Lieberman 1991, 2000), und wenn 
wir schließlich den Gedanken, dass wir die Sprache in unserem Inneren hegen, 
mit den Spiegelneuronen und der von ihnen ermöglichten Empathie weiter- 
denken?, werden wir das Überschwängliche der Worte des großen Schweizer 
Kulturphilosophen gerne akzeptieren und keinen grundsätzlichen Gegensatz 
zu der uns heute leitenden wissenschaftlichen Sicht der Sprachverarbeitung 
darin sehen. 

Ebenso kann es uns bei einem gewichtigen Wort Hugo von Hofmannsthals 
ergehen, eines Österreichers in einer schwierigen Zeit. Hofmannsthal war 
Zeuge eines Umbruchs und eines Verlustes ungeahnten Ausmaßes, aber er be- 
saß auch eine besondere Gabe dafür, Auswege aus anscheinend ausweglosen 
Situationen zu finden. Der Verzicht auf die Dichtkunst des Lord Chandos war 
ein solcher Ausweg, das Schweigen des Karl Brühl, des „Schwierigen“, ein an- 
derer. Gerade in solchen Zeiten blieb ihm jedoch unverrückt ein Bild der 
Sprache gegenwärtig, das noch heute auf uns wirken kann. 1927 berührt Hof- 
mannsthal in seiner Rede an der Universität München, Das Schrifttum als geis- 
tiger Raum der Nation diesen Punkt: 


Nicht durch unser Wohnen auf dem Heimatboden, nicht durch unsere leibliche Berührung in 
Handel und Wandel, sondern durch ein geistiges Anhangen an allem sind wir zur Gemeinschaft 
verbunden. Hierdurch unterscheiden sich unsere alten europäischen Nationen von jenem jungen, 
nach außen mächtigen amerikanischen Staatswesen, in dem wir eine Nation in diesem Sinne noch 
nicht zu erkennen vermögen. In einer Sprache finden wir uns zueinander, die völlig etwas anderes 
ist als das bloße natürliche Verständigungsmittel; denn in ihr redet Vergangenes zu uns, Kräfte 
wirken auf uns ein und werden unmittelbar gewaltig, denen die politischen Einrichtungen weder 


Raum geben, noch Schranken zu setzen mächtig sind’. 


Die Worte Hofmannsthals haben das Gewicht eines Programms, wie wir es 
heute von der Spitze der EU gewohnt sind, zugleich aber auch geben sie eine 
kulturpolitische Begründung für die Achtsamkeit und die Pflege unserer Spra- 
chen, der eigenen wie der neuen Sprachen, die in unser Leben treten. Keines- 
wegs können wir bei Hofmannsthal eine Beschränkung auf das Eigene in ei- 
nem eher eng gefassten regionalen Sinne erkennen, wie sie in Nadlers 


2 Rizzolatti et al. 2009 gibt einen Überblick über die klinisch relevanten Studien. Siehe auch Ramachandran, 
V. S. / Oberman, L. M., “Broken Mirrors”, in: Scientific American, Nov. 2006. 


3 Ich verweise auf das Faksimile des Erstdrucks http://www.ub.uni-bielefeld.de/diglib/2006/hofm_schrifttum/ 
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Literaturgeschichte so markant in Erscheinung tritt. Es geht um die Funktion 
der Sprache für das Entstehen einer Gemeinschaft, um die Vertrautheit mit 
der „Kultur“, die in der Sprache ihren Ausdruck findet. 

Ganz ähnlich äußert sich Isaiah Berlin, der große liberale Denker des vergan- 
genen Jahrhunderts, wenn er in einer differenzierten Auseinandersetzung mit 
der Aufklärung und ihrer Tendenz, das Allgemeine anzustreben, einen kriti- 
schen Blick auf den Begriff einer Gemeinschaft ohne lokale Begrenzung wirft: 


Es sei ein Fehler der Philosophen der Aufklärung gewesen anzunehmen, dass Männer und Frauen 
nach abstrakten Prinzipien und kosmopolitischen Wertvorstellungen und dem, was er einen „idea- 
listischen, aber leeren doktrinären Internationalismus“ nannte, leben könnten. 

Diese Ablehnung natürlicher Bindungen scheint mir edel, aber fehlgeleitet zu sein. Wenn die 
Menschen sich beklagen, einsam zu sein, meinen sie, dass niemand versteht, was sie sagen: Ver- 
standen zu werden bedeutet, eine gemeinsame Vergangenheit zu haben, gemeinsame Gefühle, 
eine gemeinsame Sprache, gemeinsame Voraussetzungen, die Möglichkeit vertraulicher Mittei- 


lung — kurz gesagt, gemeinsame Formen des Lebens zu teilen‘. 


Das Teilen von gemeinsamen Formen des Lebens ist auch ein „Teilen“ im Be- 
reich der Sprache. Ein Teilen, das als Hintergrund des Sprechens die Strategien 
der Sprecher lenkt, und das in der Sprache selbst als Form verankert ist. 
Helmuth Feilke hat diese „Form“ des Teilens in eindringlichen Analysen als 
„Common sense-Kompetenz“ herausgearbeitet und hat in diesem Zusammen- 
hang auf einen ersten Ansatz zu dieser Erkenntnis bei Max Weber hingewiesen: 


Das Bestehen einer ‘Sprachgemeinschaft’ bedeutet für uns nicht, daß massenbedingte Gleichartig- 
keit bei der Hervorbringung bestimmter Lautkomplexe existiere (das ist gar nicht erforderlich), 
auch nicht nur, daß der eine nachahmt’, was andere tun, sondern vielmehr ein Verhalten bei ‚Äu- 
ferungen’, welches an bestimmten, innerhalb eines Menschenkreises durchschnittlich bestehenden 
Chancen, sich ‚verständlich’ zu machen, sinnhaft orientiert ist und daher diesen Effekt im Durch- 


schnitt auch erwarten ,darf’. (Weber zitiert nach Feilke, 1994, S. 78) 


Die Menschen in einer Sprachgemeinschaft sind durch Erfahrungen mitein- 
ander verbunden, und dieser Erfahrungshintergrund ist es, der den Sprachge- 
brauch zum Erfolg führt. Die Erwartung des Erfolgs unterscheidet Sprecher 
im Umfeld einer Sprachgemeinschaft von Lernenden, die sich einer Sprache 
erst nähern. Erfolgreiche Lernende sind erfolgreich, wenn es ihnen gelingt, in 
genau diesem Sinn zu Teilnehmern der Sprachgemeinschaft zu werden. 


4 Michael Ignatieff, Isaiah Berlin. Ein Leben, (1998), S. 374. 
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Man kann von einer Kompetenz sprechen, von einer Haltung, die das „Glü- 
cken“ von Kommunikation erwartet, die mit dem Glücken rechnet. Vielleicht 
ist es gerade diese Erwartung, die das Gefühl vermittelt, „dazu zu gehören“, als 
Sprecher einer (neuen) Sprache nicht mehr in der Rolle des Anfängers zu 
agieren, sondern als vollwertiger Teilnehmer einer Sprachgemeinschaft. Wohl- 
gemerkt, ganz unabhängig von der Perfektion oder von der Fehlerhaftigkeit 
der einzelnen Äußerungen, die der Neuankömmling hervorbringt. 

Die Teilnahme an der Sprachgemeinschaft kann also auch als Haltung be- 
schrieben werden, als eine Erwartungshaltung plus einem bestimmten Grad 
von Sicherheit, dass die Erwartung auch erfüllt werden wird. Genau diese 
Haltung müssen Lernende der zweiten oder dritten Sprache erreichen. Ich 
sage „erreichen“, korrigiere diesen Anspruch aber sogleich in Gedanken an ein 
denkwürdiges Wort von Valéry über die „Kunst des Erziehenden*: 


Die Kunst des Erzichenden besteht darin, Aufmerksamkeit zu schaffen, sie freiwillig werden zu 
lassen, ihren Aufbau zu ermöglichen; sobald sie vorhanden ist, sie zu bewahren, ihre Funktions- 
weise zu kontrollieren und ihre Anwendung zu begrenzen. Man muß ihr schonend die entspre- 
chende Nahrung geben - nie zu viel, nie zu wenig, ihr ein Ziel stecken und sicherstellen, daß es an- 


gestrebt wird. (Valery 5:607) 


Und diese Haltung, mit dem „Glücken“ des jeweiligen Sprachaktes zu rech- 
nen, kann nicht gelernt sondern nur „erfahren“ werden und das heißt, durch 
wiederholtes Üben gewonnen werden. Vielleicht muss man die Haltung als 
Lernender einfach voraussetzen und dann — unter der Voraussetzung, dass das 
Vorhaben gelingen wird — immer wieder übend anwenden. Systematisches Ar- 
beiten mit Korpusinstrumenten ist ein Mittel — so möchte ich unsere Erfah- 
rungen zusammenfassen —, genau diese Haltung zu erfahren und zu erproben 
und in immer neuen Kontexten zu üben’. 


2. Schreiben im beruflichen Umfeld 

Das Erlernen der Muttersprache bis zu dem Niveau, das durchschnittliche 
Sprecher erreichen, ist eine der großen kulturellen Leistungen des Menschen. 
Das zu erreichen, was jedes normal aufwachsende Kind in seiner Mutterspra- 
che anscheinend mühelos erreicht, aber auf andere Weise als die natürliche des 
Erstspracherwerbs, nämlich durch Lernen als Jugendlicher oder als Erwachse- 
ner, scheint hingegen ein unerreichbares Ziel zu sein. 


5 Als Grußwort und Einleitung zur Tagung vorgetragen. Im folgenden Teil werden didaktische Erfahrungen 
mit Korpusinstrumenten referiert, die zu unserer gängigen Praxis gehören. (Drumbl 2002, 2005, 2009, Zanin 
2007). 
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Wenn man aber das anscheinend unerreichbare Ziel der sehr guten Sprach- 
kompetenz näher zu bestimmen versucht, verändert sich die Perspektive, denn 
was anderes kann das Ziel des Erlernens einer fremden Sprache sein, als diese 
so zu sprechen, wie Menschen sie sprechen, für die sie nicht eine fremde, son- 
dern die eigene Sprache ist? Und diese Sprache, dieses Sprechen der Mutter- 
sprachler ist von einer immensen Vielfalt von Varietäten, Varianten und quali- 
tativen Abstufungen gekennzeichnet. Ist das, was diese Menschen beim 
Gebrauch ihrer Sprache meist ohne Anspruch auf Perfektion vollbringen, so 
unvorstellbar weit entfernt von dem, was man als erwachsener Lernender ler- 
nen kann, lernen könnte, wenn das Erlernen der Sprache glücken würde? 

Man muss das lernen, was die anderen können. Dazu gehört, dass man auf das 
achtet, was die anderen fun, die Menschen, die in zweisprachigen Gebieten 
nebeneinander leben, die einer für den anderen in jedem Moment Vorbilder 
sein können/könnten für das Sprechen und das sprachliche Handeln. 
Vielleicht liegt ein grundlegender Fehler in der Haltung, überhaupt nicht hin- 
zusehen, nicht hinzuhören, wenn andere Sprecher die Sprache gebrauchen. 
Lernende der Sprache handeln oft als Wartende, sie, die Lernenden, seien ja 
keineswegs schon bereit zu handeln, sie müssten erst „lernen“. Im beruflichen 
Umfeld ist der Verzicht auf die implizite Hilfe durch das Beobachten von be- 
reits erfolgten Sprechakten kompetenter Sprecher besonders auffällig — und 
schädlich. Der hier vorgelegte Einzelfall soll als Argument dafür betrachtet 
werden, die Alternative zu erproben, das unerreichbar scheinende Ziel der 
idiomatischen Kompetenz (native-like selection) so zu behandeln als sei es ein 
ganz gewöhnliches Ziel, das ohne weiteres angestrebt werden kann und das 
keineswegs die unüberwindliche Trennlinie darstellt zwischen Muttersprach- 
lern und Nicht-Muttersprachlern.° 

Man muss das lernen, was die anderen können: das ursprüngliche Prinzip des 
Lernens bei einem „Meister“, die Störz der Lehrlinge. Das ist keine Ausbil- 
dung für Schüler, die „für später“ lernen, sondern für Lehrlinge, die in der 
Werkstatt bereits arbeiten und lernen. 

Der Weg kann durch eine Fallstudie exemplifiziert werden, die einen Moment 
des Misslingens betrachtet. Dazu wähle ich einen Moment der täglichen Ar- 
beit eines Teilnehmers unserer Sprachgemeinschaft in Südtirol und zwar im 
engeren Rahmen der Freien Universität Bozen, der dreisprachigen Universität 
mit ihren besonderen Aufgaben im Bereich der Mehrsprachigkeit. Ein kleiner 
Moment im täglichen Ablauf, statistische Daten zur Universität müssen mit 
Überschriften und einfachen Begleittexten versehen werden. Diese Kurztexte 
werden in den laufenden Text eingebunden, das Dokument erreicht die ver- 


6 Native speaker vs. Non native speaker (NS vs. NNS) in der internationalen Diskussion. 
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schiedenen Gremien, wird dort diskutiert, schließlich approbiert, gedruckt und 
verteilt. Im Normalfall wird dem sprachlichen Ausdruck in keiner der auf den 
Akt des Schreibens nachfolgenden Etappen große Aufmerksamkeit geschenkt. 
Daher ist der erste Moment, der Moment der Verschriftlichung so wichtig. 
Daher müssen die Mitarbeiter der Institutionen in der mehrsprachigen Ar- 
beitsumgebung mit besonderer Sorgfalt mit der Sprache umgehen — und sie 
müssen darin ausgebildet werden. Das ist der Angelpunkt, der diese Episode 
mit dem Thema unserer Tagung verbindet. 

Der kleine Moment des Schreibens betrifft die Überschrift zur Statistik der 
Herkunft der Studenten der Freien Universität Bozen. Über dem gewohnten 
Tortenbild der Daten kann als Überschrift kaum mehr und etwas anderes ste- 
hen als: HERKUNFT DER STUDIERENDEN. Die gender-neutrale Form hat sich 
in den letzten Jahrzehnten gegenüber dem traditionellen Sammelbegriff Sru- 
DENTEN durchgesetzt. In unserem Internetkorpus spiegelt sich diese Entwick- 
lung in der Zahl der Belege wieder: 43 „Studierenden“ stehen 13 „Studenten“ 
gegenüber. Im Alltag der Kommunikation sehen die Zahlen allerdings etwas 
anders aus (Google-Recherche vom 27. Juli 2010): 20.800 (Herkunft der Stu- 
dierenden) gegen 18.500 (Herkunft der Studenten). 

Das gibt einen ersten Anstoß zum Auswählen, wobei in diesem Fall die Wahl 
kaum als eigenständiger individueller Akt erfahren wird, sondern als Teilhabe 
einer von der Universitätsgemeinschaft vertretenen Haltung gleichsam vorge- 
schrieben ist. Diese Haltung zeigt sich darin, dass in ähnlichen Texten der 
Verwaltung und der Öffentlichkeitsarbeit gender-neutrale Ausdrücke bevor- 
zugt werden. 

Die Entscheidung zwischen zwei parallel überlieferten Varianten wäre kaum 
der Rede wert, gäbe es in diesem Text nicht eine überraschende Abweichung 
vom universell dokumentierten Sprachgebrauch. Im Text unserer Universität 
steht nämlich etwas anderes. Dort steht HERKUNFT DER GESAMTEN STUDIE- 
RENDEN. Eine wohl durch Nachdenken gefundene „hyperkorrekte“ Präzisie- 
rung, die nicht nur dem Sprachgebrauch widerspricht, sondern auch der 
sprachlichen „Logik“ der Aussage selbst, denn die Antwort auf die Frage nach 
der Herkunft der gesamten Studierenden könnte nur lauten: „aus 15 Ländern“, 
„von drei Kontinenten“ oder „vom Planeten Erde“. 


Von „den gesamten Studenten“ ist nur im Zusammenhang mit Untergruppen 
8 8 grupp 


der Studierenden die Rede (Belege dewac)’: 


7 Die Belege sind nicht redaktionell redigiert. Die Satzzeichen sind durch Leerzeichen vom Text getrennt. 
Das ist bei Korpusanfragen im PHRAsE-Fenster zu beachten. 
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Die Zahl der gesamten Studenten nach Studiengang: 

Der Prozentanteil gibt an , wie groß der Anteil der Studenten dieses einen Studiengangs gemes- 
sen an den gesamten Studenten innerhalb der Lehreinheit ist. 

Diese vier Sprecher bilden den Sprecherrat , dem die Vertretung der Interessen der gesamten Stu- 
dierenden auf Universitatsebene obliegt. 

An den Elitehochschulen ( „Grandes Ecoles“ ), die gemeinsam knapp fünf Prozent der gesamten 
Studierenden ausbilden , wird durch Aufnahmeprüfungen gefiltert. 

Dieses Feld enthält die Menge der gesamten Studierenden für die ausgewählte Studienrichtung. 


Der „innovative“ Ausdruck im Bozener Uni-Dokument wird von Google nur 
in zwei Belegen nachgewiesen, nämlich genau in zwei Texten unserer Univer- 
sität und nirgendwo sonst auf der Welt. 20 Sekunden Arbeitszeit hätten aus- 
gereicht, um den Zweifel zu beheben - falls der Zweifel aufgetaucht wäre. Die 
Stelle ist aber weder beim Schreiben noch beim Lesen aufgefallen. Die kleine 
Gemeinschaft im sprachlichen Biotop der mehrsprachigen Universität Südti- 
rols hat sich mit solchen Ausnahmen zum gängigen Sprachgebrauch abgefun- 
den und hat ein weiteres Fallbeispiel zu den bereits bestehenden hinzugefügt. 
Eine Enklave eines abweichenden Sprachgebrauchs wird geschaffen und für 
weitere Nutzung geöffnet. 

Die Menschen in dieser Enklave handeln anders als die „normalen“ Mitglie- 
der der Sprachgemeinschaft, sie haben keinen Anteil am Bewusstsein der 
sprachlichen Muster, denen das alltägliche Sprechen seine Routinen verdankt. 
Vorgefertigte Muster, die von den Teilnehmern der Sprachgemeinschaft ge- 
teilt werden, erleichtern die Anstrengung des Schreibens und des Sprechens 
ungemein. Ohne diese Fertigteile müsste jeder Gedanke auf eine individuell 
gestaltete Art und Weise ausgedrückt werden — ein kognitiver Aufwand, dem 
die Menschen im Normalfall ausweichen, um ihre Ressourcen dem Aufbau 
des Gemeinten, der Strukturierung ihres Redebeitrags zu widmen, und der 
Aufmerksamkeit auf die Sprechakte des Gegenübers. 

Das Adjektiv „gesamte“ ist fehl am Platz und dieses Fehl-am-Platz-Sein be- 
trifft das Adjektiv selbst. In diesem Fall sind die Gebrauchsbedingungen — die 
constraints — überzeugend nachzuweisen, es sind spezifische Bereiche im Um- 
feld politischen und gesellschaftlichen Überblicks, der Verwaltung, bevorzugt 
in fachsprachlichen Bereichen, in denen das Adjektiv mit hoher Frequenz ge- 
braucht wird. 

Hier nach den Wortprofilen des dwds abgebildet*: 


8 Siche dazu Geyken in diesem Band. 
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Der Verfasser der Broschüre wählt das Adjektiv „gesamt“ ohne an die traditio- 
nellen Gebrauchsbeschränkungen und Muster zu denken. Es sind dies die 
Muster, auf die er sich beim normalen Sprechen stützen würde und auch tat- 
sächlich stützt. Hätte der Verfasser eines Textes Anlass, Wörter wie „Bundes- 
gebiet“, „Außenhandel“ oder „Belegschaft“ zu verwenden, dann läge auch der 
Schritt zur Verwendung von „gesamt“ nahe. In Kontexten, in denen keine im 
Wortprofil nachgewiesene „Begleiter“ des Adjektivs „gesamt“ vorkommen, 
sinkt die Wahrscheinlichkeit entsprechend. Wer den Bericht über die Freie 
Universität Bozen verfasst oder übersetzt hat, hantiert an dieser Stelle ganz of- 
fensichtlich mit einem Wort in Isolation, wie Wörter beim Übersetzen der ru- 
dimentären Form des Wort-zu-Wort-Übersetzens vorkommen. Das Wort hat 
alle latenten Bezüge zu Kontexten, zu Kollokationen und zu Gebrauchsfor- 
men und Mustern verloren. 

Der zufällig gefundene „Fehler“ ist als Indiz für ein Verhalten zu deuten, das im 
Umfeld der Mehrsprachigkeit tagtäglich vorkommt, das Isolieren von Wörtern, 
das in der Folge zu einer Überangestrengtheit beim Sprechen und beim 
Schreiben führt, und zu einer Art Hyperkorrektismus in eigener Verantwor- 
tung. Dass dabei eine ungewöhnliche und ungewohnte geistige Anstrengung 
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erbracht werden muss, ist das eigentliche Problem, nicht der Fehler als solcher, 
der in Folge dieser fehlgeleiteten Anstrengung entstanden ist. Hyperkorrektis- 
mus und Verunsicherung gehen Hand in Hand. Wer so genau kontrollieren 
will, ist sich der Gefahr des fehlerhaften Sprachgebrauchs bewusst. Er/sie er- 
ganzt die normale Aussage durch das Adjektiv „gesamten“ aus Angst vor einem 
ungenügenden Ausdruck, im Bewusstsein, „vollständig“ denken und schreiben 
zu müssen, als ob die Last der Sprache allein auf den Schultern des Einzelnen 
läge, der sich gerade voller Skrupel an das Verfassen einer kleinen Überschrift 
macht. Warum wird ein Moment der Unsicherheit nicht zu einem Moment 
des Lernens, zu einem Blick auf die est practice, auf Vorbilder, die ohne großen 
Aufwand aufgerufen werden können? 

Der Kontakt mit den Sprachen am Arbeitsplatz erscheint hier als Handeln in 
der Isolation der eigenen, abgeschotteten Sprache, ein Handeln, als ob es keine 
anderen Menschen gäbe, die unsere Sprache verwenden und keine Texte, in 
denen dieses sprachliche Handeln aufgezeichnet wäre. 


3. Stabilisierungsprozesse 

Mit der Angst vor dem Fehler ist ein zentraler Punkt des Spracherwerbs und 
des Sprachunterrichts in der Schule angesprochen. Zur Angst kommt die täg- 
lich erneuerte Erkenntnis des Misslingens von Mitschülern und von Men- 
schen im sozialen Umfeld, denen es nicht gelungen ist — und nicht gelingen 
will — die fremde Sprache zu lernen. Was den anderen neben mir nicht gelingt, 
warum sollte es „mir“, dem Einzelnen gelingen, der sich gerade daran macht, 
die Sprache zu lernen? 

Sprachenlernen in der Schule bringt in der Tat — vor allem für schwächere 
Schüler — neben den entmutigenden Beispielen weitere Nachteile mit sich. 
Der Syllabus ist nach den Bedürfnissen der Institutionen konzipiert, die be- 
stimmte Ergebnisse anstreben und durchsetzen müssen. Die einzelnen Lern- 
schritte setzen Vorkenntnisse und skills voraus, die nicht von allen Schülern 
zum Zeitpunkt der Behandlung des Programmpunktes in ausreichendem 
Maße beherrscht werden. Dadurch entstehen immer neue Differenzen in der 
Sprachkompetenz, aber auch in der Bereitschaft, die neue Sprache zu lernen 
(Han 2004, 2009). Differenzen, die immer wieder dieselben Schüler aus- 
grenzen. 

Dieses „Zurückbleiben“ der einen, das „Nicht-Mitkommen“ mit den anderen 
Lernenden, denen das Lernen gerade im richtigen Moment gelingt, ist eine 
Grunderfahrung der Lernenden wie der Lehrenden von Fremdsprachen in 
der Schule. 
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Die andere Grunderfahrung der meisten Lernenden ist die Erkenntnis, dass es 
ihnen nicht gelingt und wohl auch in Zukunft wahrscheinlich nicht gelingen 
wird, alle grammatikalischen Feinheiten zu erkennen, zu verstehen und zu ge- 
brauchen, so wie es ihnen nicht gelingt, die Feinheiten der Aussprache, vor al- 
lem der Intonation wahrzunehmen und selbst adäquat auszudrücken. Immer 
wieder machen sie dazu noch die Erfahrung, dass ihr Wortschatz unvollstän- 
dig ist. Selbst nach jahrzehntelangem Aufenthalt im Land und aktiver Teil- 
nahme an den Aktivitäten der Menschen dieser Sprachgemeinschaft erkennen 
sie immer wieder Lücken in ihrer Sprachkompetenz, so dass es den wenigsten 
gegeben ist, die zweite oder dritte Sprache im Gefühl zu gebrauchen, von jeder 
störenden Unzulänglichkeit frei zu sein. 

Je fortgeschrittener die Sprachkompetenz und die Sprachbewusstheit des 
Sprechenden, desto klarer die Erkenntnis, dass seine Sprachkompetenz auf 
eine ganz eigene, auf eine persönliche Weise „lückenhaft“ geblieben ist: 
Manchmal fehlen ganze Bereiche des Alltags, manchmal fehlen bestimmte 
Register, manchmal geht eine deutliche Trennlinie zwischen mündlicher und 
schriftlicher Kompetenz, und andere Fälle mehr. 

Dieser Zustand ist stabil. Und in den meisten Fällen bleibt er stabil, ein Leben 
lang. Der einzelne Sprecher sieht die eigene Sprachkompetenz im Normalfall aber 
nicht im Vergleich zur Kompetenz der Anderen. Er misst sich nicht an den ande- 
ren und hat kein konstantes Gefühl des Unbehagens an seinen beschränkt(er)en 
Möglichkeiten des Ausdrucks. Die Beschränkungen werden aber von den verunsi- 
cherten Lernenden wahrgenommen und als Indizien eines Defizits empfunden. 
Fossilisierung wurde in der Forschung oft als Symptom des verhinderten Er- 
werbs einer Sprache, des verhinderten Weitergehens beschrieben: „that lear- 
ners typically stop short of target-like attainment“ (Han 2006:137 als Ge- 
meingut der Forschung zitiert), so dass das Beharren auf einer bestimmten 
Stufe der Interimssprache auch generell als „incompleteness“ der Sprachkom- 
petenz der Lernenden bezeichnet wird (Schachter 1988, 1996). In einer 
lernerzentrierten Sicht, die sich nicht auf didaktische Strategien beschränkt, 
sondern die auch die Haltung des sprechenden Menschen zur Sprache und 
seinen Umgang mit Sprachen im Alltag beobachtet, erscheint die Fossilisie- 
rung als Phänomen, das jeden Betroffenen auf eine ganz eigene, idiosynkrati- 
sche Weise trifft. Bestimmte Merkmale können bei vielen Sprechern vorkom- 
men, einige nur bei wenigen, die genaue Verteilung der Merkmale aber ist 
unbestimmbar. Sie variiert auch innerhalb der sprachlichen Aktivitäten des 
Einzelnen, ist von Faktoren abhängig wie der Modalität, der Registerebene, 
des Grades an Aufregung, an Vorbereitung, an Sachkenntnis, und all der Fak- 


toren, die bei kommunikativen Anlässen eine Rolle spielen können. 
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In vergleichender Sicht erscheinen die „Mängel“ von Fall zu Fall als Eigenhei- 
ten eines Sprechers, der mit Stress weniger gut umgehen kann, der mit der ho- 
hen Stilebene weniger gut vertraut ist, der im Zusammenfassen komplexer 
Texte wenig Ubung hat, und dessen Stimme ungeübt ist im öffentlichen Vor- 
trag. Es ist eine Fülle von Einzelheiten des Sprechens, des Vortragens, des 
Komponierens, des Meinens und des Ausdrückens von Gemeintem, die dem 
aufmerksamen Sprecher aus vielen Momenten des Alltags vertraut ist. 


4. Das Konzept „Resonanz“ und seine neuronale Grundlage 
Beim Zusammenleben zweier oder mehrerer Sprachen werden durch wieder- 
holten Sprachgebrauch die Einzelteile mit anderen Sprachteilen vernetzt. 
Wörter und Wortgruppen verbinden sich in einem Netz von Wahlverwandt- 
schaften zu Einheiten, die zusammen mit anderen ein eng geflochtenes Ge- 
meinsames an Sprache bereitstellen, das nachhaltig im Gehirn gespeichert ist. 
Bei jedem Aufrufen eines Einzelnen werden zugleich die mit-verbundenen 
sprachlichen Elemente aktiviert, die als „Resonanz“ zu den jeweils aufgerufe- 
nen sprachlichen Elementen dazukommen?. 

Mit Hilfe der Resonanz wird ein Raum für jede neue Sprache geschaffen, der 
im Folgenden von anderen Sprachräumen gegen ungewollte Einflüsse (Inter- 
ferenzen) gleichsam abgeschirmt wird. Je mehr solcher miteinander verbunde- 
ner Wörter bereits im Gehirn gespeichert sind, desto leichter finden Neuan- 
kömmlinge den Ort für sich selbst, desto schneller kann man sie sich merken. 
Beim simultanen Spracherwerb von Kindern, aber auch beim Spracherwerb 
im fortgeschrittenen Alter, wird jede Sprache im Gehirn „verwurzelt“, und im 
Fall von Mehrsprachigkeit bilden sich getrennte sprachliche Systeme aus, die 
sich im Lauf des Spracherwerbs immer stärker voneinander abgrenzen. Der 
Übergang von der einen zur anderen Sprache wird dabei von eigenen neuro- 
nalen Strukturen geregelt, die von Forschern des „San Raffaele“ in Mailand 
genau im Gehirn lokalisiert werden konnten (Abutalebi et alii, 2007; vgl. 
Drumbl 2009: 76-77). Die Erforschung der „Switches“ beim mündlichen 
Sprachgebrauch hat ein Ergebnis erbracht, das von den Autoren der Studie 
sogleich in seiner Tragweite für den Unterricht der Zweitsprache erkannt wur- 
de. Entgegen den Erwartungen war der Aufwand an kognitiver Kontrolle 
beim Wechsel von der Zweitsprache zur Erstsprache höher als umgekehrt. Es 
handelte sich dabei um Versuchspersonen, die in jahrelangem Kontakt mit der 
Zweitsprache leben und die ihre Erstsprache weniger benutzen als die Zweit- 


9 Bates/Goodmann 1999, McWhinney 1987. In diesem Zusammenhang ist auch die Darstellung der Pri- 
ming-Effekte von Bedeutung; vgl. Hoey 2005. 
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sprache. Damit ist erwiesen, dass neuronale Strukturen durch Kontakt mit der 
Sprache geschaffen werden, mit anderen Worten, dass die Sprachen und ihre 
neuronalen Grundlagen durch Lernen entstehen. Das Gehirn wächst beim 
Erlernen der neuen Sprache mit. Auch im Erwachsenenalter. 
Fremdspracherwerb verläuft oft unter extrem ungünstigen Ausgangsbedin- 
gungen. Wenn die zweite Sprache zu schwach ist, um den Prozess der Reso- 
nanzbildung auszulösen, besteht die Gefahr, dass die Voraussetzungen für die- 
sen Prozess überhaupt nicht geschaffen werden, so dass die Lernenden 
eigentlich immer am Anfang stehen und bei Null beginnen. Daher ihr Be- 
dürfnis, sich mit Hilfe der Wort-für-Wort-Übersetzung ein Minimum an Si- 
cherheit zu verschaffen, das die nicht erreichbare Sicherheit durch die syste- 
matische Ausbildung der Sprachkompetenz kompensieren soll. In einem 
Artikel, der auf jahrelangen Vorarbeiten von Elizabeth Bates aufbaut, ist diese 
neue Sicht der Sprache und der Sprachkompetenz so beschrieben: 


When the child’s two languages are roughly similar in dominance or strength, each system gener- 
ates enough system-internal resonance to block excessive transfer. However, if one of the languag- 
es is markedly weaker, then it will not have enough internal resonance to block occasional transfer. 
The situation is very different for L2 learners, since the balance between the languages is then 
tipped so extremely in favor of L1. In order to permit the growth of resonance in L2, learners 
must apply additional learning strategies that would not have been needed for children. These 
strategies focus primarily on optimization of input, promotion of L2 resonance, and avoidance of 


processes that destroy input chunks. (Hernandez et alii 2005: 18). 


Die Resonanz entsteht durch das Vernetzen von Wortern. Wortschatz und 
Grammatik spielen dabei zusammen eine Rolle und können daher auf keiner 
Ebene des Sprachgebrauchs und der Sprachbetrachtung voneinander getrennt 
werden, weder im theoretischen Modell der Sprache, noch im Hinblick auf die 
Prozesse des frühkindlichen Spracherwerbs, noch als Grundlage des Erlernens 
von Sprachen in fortgeschrittenerem Alter. Grundelemente der Sprache sind 
„Konstruktionen“ (Goldberg 2003, 2006, Feilke 2007), typischerweise Mehr- 
Wort-Ausdrücke, die schon beim alltäglichen Gebrauch eine zusammenhän- 
gende Einheit bilden. Beim Gebrauch von Konstruktionen werden sowohl die 
einzelnen Elemente als auch die idiomatisch geprigten Ausdriicke gelernt und 
beim Sprechen „wiederholt“. Es kommt zu einer Fülle von Begegnungen mit 
der neuen Sprache. Sprache wird als statistisch relevantes Phänomen erfahrbar, 
und die Muster, in denen sprachliche Konstruktionen im Alltag des Sprachge- 
brauchs in Erscheinung treten, werden als relevant erkannt und erleichtern das 
Erlernen der Grundelemente, aber auch das Fortschreiten im Umgang mit 
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sprachlicher Komplexität in einem Lernprozess, der sich über die gesamte Le- 
bensspanne der Menschen erstreckt. 


5. Förderung der „Resonanz“ durch Lernen mit 
Korpusinstrumenten 

Das Wachstum der Resonanz muss im Unterricht bevorzugt gefördert werden. 
Dazu gehört, dass das Lernen auf der Grundlage der Erstsprache unterbunden 
und das Lernen von fertigen Einheiten, chunks, unterstützt und gefördert wer- 
den. In dieser Perspektive kann die Arbeit mit Korpusinstrumenten hervorra- 
gende Dienste leisten. Die Suche in Korpora, selbst-motiviert und als entde- 
ckendes Lernen gestaltet, wird zu einem wirkungsvollen Instrument des 
Lernens. Gelernt werden sollen Mehr-Wort-Verbindungen, und zwar nicht nur 
die phraseologisch unmittelbar in ihrer funktionalen Evidenz erfahrbaren prag- 
matisch verwertbaren Einheiten, sondern auch andere, mehr oder weniger sta- 
bile Verknüpfungen, die in Texten tatsächlich aufscheinen und den - oft noch 
unerkannten — Kern der Sprachkompetenz des Einzelnen darstellen und zu- 
gleich als Bindeglied zwischen den Sprachteilnehmern fungieren (Wray 2001, 
Belica 2001, Heringer 1999, Bubenhofer 2009). 

Geschult wird bei diesem abgeleiteten sprachlichen Handeln des „Suchens“ nach 
Korpusbelegen, die Aufmerksamkeit nicht nur auf die Form, auf wiederkehrende 
Muster zu lenken, sondern auch ein Gefühl dafür zu entwickeln, mit welcher 
„Wahrscheinlichkeit“ bestimmte Zusammenstellungen tatsächlich aufscheinen. Es 
handelt sich gleichsam um eine Metaebene der Resonanz-Phänomene, die unbe- 
wusst vor sich gehen. 

Je stärker beim Gebrauch einer Zweitsprache die Resonanz ausgebildet ist, 
desto leichter können andere Wörter, „Neuankömmlinge“, sich in das beste- 
hende Netz einfügen und ihrerseits wieder, als neu gespeicherte Wörter, ande- 
re, neu hinzukommende Wörter verankern. Je weniger Wörter gespeichert 
sind, desto schwerer ist es Wörter zu lernen. 

Daraus ergibt sich eine Definition des kompetenten Sprechers, bzw. der mut- 
tersprachlichen Kompetenz: Das Maß der Kompetenz ist der Grad an Ver- 
knüpfung der sprachlichen Elemente im Resonanzraum der betreffenden 
Sprache. Erfolgreich ist der Erwerb der Zweitsprache dann, wenn der zweiten 
Sprache in der Konkurrenz zur Erstsprache genügend Aktionsraum zur Verfü- 
gung steht, um die „Resonanzen“ aufzubauen, die als funktionaler Hinter- 
grund für den Sprachgebrauch dienen. 

Das Modell der Resonanz als Grundlage des Sprachgebrauchs und des Spracher- 
werbs gibt dem Begriff der Fossilisierung eine neue Grundlage. Fossilisierung ist 
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anders als „native-like selection“. Fossilisiertem Sprachgebrauch fehlt nicht eine 
bestimmte Menge an Regeln oder an sprachlichen Mitteln, der Sprecher geht mit 
den verfügbaren sprachlichen Mitteln anders um. Die normale „fluency“, die „na- 
tive-like selection“ ist kein Zustand, sondern eine Bewegung im Feld der Reso- 
nanz, eine Bewegung mit immer neuen Veränderungen, Verstärkungen bestimm- 
ter Resonanzen, Abschwächen anderer, die dann beim Sprechen oder beim 
Schreiben zu den jeweils aktuellen Priming-Effekten führen. 

Priming und Resonanz sind die zwei Pole, zwischen denen die native-like se- 
lection angesiedelt ist, wo sie sich entfaltet und wo sie sich zu erkennen gibt. 
Das Ergebnis solchen Sprechens, eines Sprechens, das als normales Ergebnis 
„normal“ gute Äußerungen hervorbringt? Diese Sprachkompetenz ist „gut“, 
allerdings auf eine unvorhersehbare Weise gut. Der einzelne Sprechakt, die 
einzelne Äußerung haben keine genormte Qualität, die „erreicht“ werden 
könnte, die Qualität zeigt sich beim Aktualisieren des Sprechaktes und sie ist 
unvorhersehbar. 

Die Leichtigkeit, mit der diese Qualität erreicht wird, gehört zu ihr wie das 
Staunen des Zuhörers oder Lesers, der sie wahrnimmt. 

Diese konsolidierte Erfahrung, durch Selbstbeobachtung und jahrzehntelange 
Beobachtung von Lernenden gewonnen, erhält neue Konturen durch Beob- 
achtungen aus dem Bereich des Lernens mit Korpora. 

Dem Bild der „unvorhersehbaren hohen Qualität“ beim Sprachgebrauch 
entspricht die zufällig gewonnene Einsicht beim Lesen von besonders auffälli- 
gen, „brauchbaren“ Korpusbelegen. Diese glückhaften Funde haben mit dem 
Serendipity-Prinzip zu tun, das von Grund auf zur Suche in Korpusbelegen ge- 
hört. 

Das im Serendipity-Prinzip enthaltene Finden entspricht wiederum dem Ent- 
decken oder dem Bestimmen von Prototypen im Umgang mit heterogenen 
Daten. Das diesen Momenten innewohnende Ordnungsprinzip ist an ver- 
schiedenen Stellen greifbar. Immer geht es um ein Zentrum, das in loser Wei- 
se mit Daten verbunden ist, die mit diesem Zentrum einen Bezug aufbauen, 
oder durch einen Bezug verbunden sind. 

Grundprinzip ist die Vernetzung, die Verknüpfung von Daten. 

Wie können wir uns vor diesem Bild das Gegenbild des Sprechens im Rah- 
men einer fossilisierten Sprachkompetenz vorstellen? Beim fossilisierten Spre- 
chen gibt es nichts Unvorhersehbares, also auch kein „Glücken“ in besonderen 
Momenten, keine Bewegung auf dem Feld der Resonanz mit immer neuen 
Veränderungen. Die Beziehungen sind festgefügt und unveränderlich. Das 
entscheidende Merkmal scheint dabei nicht einmal das zu niedrige Niveau zu 
sein, auf dem sich diese Erstarrung eingependelt hat, sondern die Tatsache, 
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dass tiberhaupt eine Erstarrung eingetreten ist, die den Platz der Bewegung 
eingenommen hat. Es gibt fossilisiertes Sprechen auf sehr hohem sprachli- 
chem Niveau. Gleichsam ein fehlerfreies fossilisiertes Sprechen. 


6. Sprachen lernen mit Korpusbelegen 

Warum Lernen mit Korpora? Und die Antwort: Um eine Haltung einzuüben. 
Eine Haltung, die zumindest beim Zweitsprachunterricht unverzichtbar ist. 
Eine Haltung, die auch beim Erlernen einer Fremdsprache in der Schule sinn- 
voll und fruchtbar ist, da sie autonomes Lernen ermöglicht und fördert. Eine 
Haltung, die Lernen zu einem als sinnvoll erfahrbaren Tun werden lässt. 
Geschult wird beim sprachlichen Handeln des „Suchens“, die Aufmerksamkeit 
nicht nur auf die Form, auf wiederkehrende Muster zu lenken, sondern auch 
ein Gefühl dafür zu entwickeln, mit welcher „Wahrscheinlichkeit“ bestimmte 
Zusammenstellungen tatsächlich aufscheinen. 

Arbeitsinstrument sind Korpora deutscher Gegenwartssprache, darunter auch 
sehr kleine Korpora (Ghadessy / Henry / Roseberry, 1996), die mit einer auf 
das Wesentliche beschränkten Suchsoftware befragt werden. 


SketchEngine Korpus Selbs Justiz: Lemma bleiben 


Firner Direktor geworden , aber für mich blieb er Kortens alerter Assistent . „ 


brachte der Kellner einen Rohkostsalat . „Ich bleibe bei meinem Apollinaris . Fur dich habe 


meinem Kater , erzàhlen kònnen und lieB es bleiben . Ich trank den Mokka aus , und Korten 
fòrmlich werden . Thomas ware hartnackig geblieben . Aber Danckelmann unterbrach : „Es hat 
mehr auffällig . Aber nach meiner Meinung bleibt der eine Bombe , die weitertickt . „ Das 
sprang auf . „ Kann leider nicht länger bleiben . Bin auf ein Uhr zum Personenschutz ,, 
auf dem Werksgelände . Auf dem sollte ich bleiben ? Ich wollte mit Firner reden . In seinem 


Betriebe im Rahmen des an sich Zulässigen bleiben , aber das Wetter damit nicht mehr fertig 


vom Büfett zu seinem Tisch steuerte . Er blieb kurz stehen . „ Grüß Sie , haben Sie etwasZur 
auf einem Laborschemel Platz zunehmen und blieb selbst mit hängenden Schultern vor dem 
nicht oft , daß ich vormittags zu Hause bleibe . Nicht nur , weil ich viel unterwegs bin 


Western dreht und zeigt - ich bin ihnen treu geblieben . Es war zehn Uhr . Ich hatte , Heaven's 


ich will mich bemühen , verständlich zu bleiben .Wir haben dafür gesorgt , daß auf eine 

wäre froh , wenn Sie mit uns in Kontakt blieben . Setzen wir uns Montag vormittag wieder 

gut verplombt , daß das nicht unbemerkt bliebe . Die andere Einbruchstelle ist die Sammelstelle 
die kapitalistische Industrie sein . Dann bleibt für uns vom Staat die Rolle der Russen 


zum Baden gehen würde , müßte ich draußen bleiben . Schade , ich hatte mich darauf gefreut 


„das muß aber bitte unter uns bleiben „, einen Ausdruck des aktuellen Stands 
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ich deinen Fall gelòst habe , aber es auch bleiben lassen. „Nicht so empfindlich , mein 


eine schöne blonde Nazisse war und auch blieb , bis sie zur vollschlanken 


Schon der erste Beleg erweist sich als äußerst produktiv: „... Firner Direktor 
geworden, aber für mich blieb er Kortens alerter Assistent“. Die polaren Rol- 
len „Direktor“ und „Assistent“ sind als Internationalismen spontan verständ- 
lich, dadurch kann die semantische Funktion des „bleiben“ inferenziell mit 
großer Sicherheit erschlossen werden. Der zweite Beleg, „Ich bleibe bei mei- 
nem Apollinaris. Für dich habe....“ weckt das Interesse an der Fortsetzung: 


Es waren zwei Gedecke aufgelegt , und als wir uns setzten , brachte der Kellner einen Rohkostsa- 
lat . „ Ich bleibe bei meinem Apollinaris . Für dich habe ich einen Chateau de Sannes bestellt , du 
magst ihn doch . Und nach dem Salat einen Tafelspitz ? „ Mein Lieblingsgericht . Wie nett von 


Korten , daran zu denken . 


Ein klar strukturiertes Frame mit ausgewählten sprachlichen Elementen, die 
zusammen passen. Beim Durchforsten der KWIC-Liste springt das Auge von 
Beleg zu Beleg, sucht nach Interessantem, Auffälligem und setzt sogleich die 
unterschiedlichen Beispiele zueinander in Beziehung. 

Die Suche ist funktional im Hinblick auf das Erlernen der Sprache. Was bei 
der Suche „funktionieren“ soll, sind ja nicht die von der Software gesteuerten 
Suchprozesse, sondern die Lernprozesse im Hirn des Lernenden. Mit Hilfe 
der Suche sollen Lernprozesse aktiviert werden, die ohne die Hilfe des exter- 
nen Mittels nicht (so leicht / so systematisch) aktiviert werden könnten. Die 
Lernenden sollen /ernen, sich der Sprache auf eine Art und Weise zu nähern, 
die es ihnen ermöglicht — die sie dazu führt — immer wiederkehrende Muster 
wahrzunehmen, darunter auch die Muster der formelhaft verbundenen Wör- 
ter, der Zusammenstellungen, die mit größerer statistischer Wahrscheinlichkeit 
auftreten als andere, die ebenso gut möglich wären. 

Die Lernenden können dabei beobachten, wie die „Formel“, der gerade ihre 
Aufmerksamkeit gilt, auf eine für sie typische Weise mit dem Kontext links 
und rechts der Formel zusammenhängt. Sie können beobachten, wie „umfas- 
sendere“ Muster entstehen und gezielt wahrnehmen, an welchen Stellen Vari- 
ablen aufscheinen, die bei anderen Gelegenheiten mit anderen Inhalten auf- 
treten werden. Sie erkennen, wie durch Inhalte Kohärenz geschaffen wird und 
wie diese Kohärenz mit der kohäsionsbildenden Form, mit den Formeln (,,for- 
mulaic language“) zusammenhängt. 
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7. Kostruktionen erkennen, erfahren, lernen 

Es geht um eine propädeutische Hinführung der Lernenden zur Sprache, 
und zwar nicht nur um das Erkennen von formalen Mustern, sondern von 
Funktionstypen, die als Muster in Erscheinung treten. Die idiomatische 
Kompetenz des muttersprachlichen Sprechers besteht darin, keine Kon- 
struktionen zu verwenden, die nicht auch von den anderen Teilnehmern der 
Sprachgemeinschaft verwendet werden. Aus der Gesamtmenge aller gram- 
matikalisch möglichen werden nur die idiomatischen beachtet und gelernt. 
Das führt dazu, dass einige Konstruktionen mit weit größerer Wahrschein- 
lichkeit gebraucht werden und deshalb öfter in Alltagsgesprächen aufschei- 
nen werden, als andere. Beim normalen Umgang mit den Mitgliedern der 
Sprachgemeinschaft, kommt der Lernende also oft mit den „usuellen“, das 
heißt, den tatsächlich gebrauchten Konstruktionen in Kontakt und braucht 
sich nicht darum zu kümmern, eventuell mögliche Konkurrenzformen ex- 
plizit auszuschließen”. 

Unsere Schulbücher sind aber voller sprachlicher Ausdrücke, die von der 
„Grammatik“ generiert wurden, aber im Leben der Menschen keinen Ort ha- 
ben. In der Schule haben sich Nischen der Nicht-Idiomatizität gebildet, von 
denen sich die vom Usus abweichenden Formen wie Viren ausbreiten, wenn 
man ihrer Verbreitung nicht entgegenwirkt. Südtirol, das mehrsprachige Land, 
spielt hier eine Vorreiterrolle, wo manche Probleme früher, konzentrierter und 
übersichtlicher in Erscheinung treten als anderswo. In Bayern und in Öster- 
reich finden wir den idiomatisch abweichenden Sprachgebrauch in Bereichen 
der Schriftlichkeit ebenso wie in Südtirol, aber als Einzelfälle, die nicht syste- 
matisch wahrgenommen werden. Bei uns erkennt der geschulte Beobachter 
ein und dasselbe Phänomen bei Sprechern des Deutschen als Erst- und als 
Zweitsprache dazu noch bei Italienisch als Zweitsprache. Dazu kommt das 
neue Phänomen der ganz und gar unidiomatischen neu-englischen Kommu- 
nikationssprache, die von Muttersprachlern des Englischen beinahe wie eine 
Fremdsprache gelernt werden muss und in der sich viele unserer globalisierten 
Mitbürger trotz der fehlenden nazive-like selection so wohl fühlen. 


In dieser Situation einer zunehmenden sprachlichen Veränderung - ich würde 
von wachsender „Verunsicherung“ sprechen, wenn man mir den erhobenen 
Zeigefinger durchgehen lässt — ist unser Projekt „Korpus Südtirol“ entstanden, 
das einen Schwerpunkt in didaktischen Anwendungen hat. Die drei Schul- 
sprachen Deutsch, Italienisch und Englisch sind gleichwertig präsent, sodass 
die ersten Erfahrungen mit der Ausrichtung auf Idiomatizität genau dort er- 


10 Belica, in diesem Band, Steyer 2004. 
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lebt werden können, wo der einzelne Lernende seine ganz eigene persönliche 
Disponibilität mitbringt. Immer wieder haben wir erlebt, dass Studierende, 
denen die Korpusinstrumente an Hand deutscher Beispiele präsentiert wur- 
den, spontan gefragt haben: „Gibt es das auch für unsere Muttersprache Italie- 
nisch?“ 

Der mehrsprachige Zugang ist ein entscheidendes Merkmal unseres Projekts, 
ein Fixpunkt, der bei jeder neuen Anwendungen aufs Neue seinen Wert er- 
weist. Die Lernenden erfahren den Umgang mit Korpora sogleich als Anlei- 
tung zu einer „Haltung“ gegenüber den Sprachen, nicht als Instruktion, die auf 
das Erlernen bestimmter phraseologischer Ausdrücke abzielt. 

Dass Korpus-Recherchen auch im Anfängerunterricht produktiv sein können, 
möchte ich an einem italienischen Beispiel zeigen. Eine deutsche Kollegin, die 
gerade begonnen hat, Italienisch zu lernen, erhält in der zweiten Stunde einen 
hochkarätigen Text aus der Kulturbeilage einer Tageszeitung, von dem sie auf 
den ersten Blick das Bild und die zwei Überschriften wahrnimmt: 


Il dono della libertà 


Il miracolo dell’identità 


Der zweite Text mit seinen Internationalismen ist ohne Probleme zu verste- 
hen, beim ersten denkt sie — eine typische /eczio difficilior — an die Tücken des 
Begriffs Freiheit und schreibt dem unbekannten “dono” spontan negative Kon- 
notationen zu. 


dalla mua infermatà , grane Signore per d dono della tuo Spinto Santo nella nua vita 
visita di funzionari cinesi in Sud Africa I dono della sintesi che sacrifica la hberta 
più un’ utopia ma noi cristiani abbiamo d dono della speranza partendo da ciò che già 
retroguardia e l' amore divino ; portano con se il dono della guarigione conferitogli dalla loro 
equiparare la grazia soprannaturale coni doni della natura , significa violentare il 
tutti gh essen : quando non possiedono il dono della trasformazione , col tempo sprofondano 
allora non aveva mau pensato di desiderare i dono della trasformazione . Più di una scunerza 
Gangi , rotta , è stata riappiccicata Dono della fam Vigo Pennisi di Gallodoro 
da poten straordinan alcuna avevano il dono della guangione , aiin potevano accendere 
Ross" Stato di conservazione buono Dono della faragha Rossi di Acicatena Inv 
di conservazione . restaurato nel 1988 . Dono della Banca Popolare Santa Venera di Acireale 
superficie del colore è alquanto mandita . Dono della farraglia Romeo Marone . Inv. 37 
x46 Stato di conservazione buono Dono della Società & S. Vincenzo dei Paok 
tentoni , nella loro ricerca chiedono a Dio il dono della pace e si impegnano affinché le loro 
da Gerusalemme (Le 24,47 -49 ) nel dono della pace divna messiazuca e nell’ investitura 
urnversale  * I santo non è qualcuno che ha il dono della profezia o quello & fare i miracoli 
antropologia negahva per chi non disponga del dono della grama può wtrodurre a un’ nterpretazione 
forte richiamo , cioè : chi ha avuto questo dono della graria e , possiamo dire ‚il dono 
dono della grazia e , possiamo dire „U dono della fede , deve cercare — senza mas forzare 
quella chuusura del sacnäcıo per mezzo del dono della passione e chiamano ı credenti a 
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Bei der Suche mit der Teilformel „dono della“ stößt sie auf viel Unverstandli- 
ches aber auch auf deutliche Indizien, die gegen ihre spontan erstellte Hypo- 
these sprechen — eine Hypothese, tiber die sie sich nicht einmal Rechenschaft 
abgelegt hat. Ich gehe noch weiter. Die Lernende hat wahrscheinlich über- 
haupt nicht nach den Konnotationen von „dono“ gesucht, aber wegen ihrer 
fehlenden Sprachkenntnisse blieb alles Sprachliche ausgeblendet außer eben 
den stichwortartig eingeblendeten verständlichen Ausdrücken, die von ihr als 
„Werte“ wahrgenommen wurden: 


Spirito Santo, natura, pace, grazia, fede, passione 
famiglia Rossi, famiglia Romeo Marone 


Banca Popolare, Societä di S. Vincenzo dei Paoli 


Sie hat in der KWIC-Liste etwas gefunden, ohne danach gesucht zu haben. 
Das ist das Serendipity-Prinzip der Korpussuche. Dass sie gerade Konnotatio- 
nen wahrnimmt, ist kein Zufall, denn ihr spontanes Verständnis des Titels war 
ja stark von der Hypothese geprägt, „dono“ sei von negativen Konnotationen 
bestimmt. Sie hat also spontan aus der KWIC-Liste gezielt solche Belege ko- 
gnitiv verarbeitet, die als Verifizierung/Falsifizierung ihrer Hypothese zu ge- 
brauchen waren. Und kaum war sie zu einem Ergebnis gekommen, da war 
auch schon die hypothetische Zuordnung einer Bedeutung da. Sie identifizier- 
te das italiensche „dono“ über das französische „don“ als „Geschenk“. 

Dass sie überhaupt auf Ihre Französischkenntnisse zurückgegriffen hat und 
nicht, wie zu Beginn der Arbeit, ausschließlich auf das übersetzende Deuten 
ins Deutsche hinüber fixiert war, ist der Suchstrategie zu verdanken, die sie — 
über die Suche nach der Konnotation des ihr unbekannten Ausdrucks — von 
der Sprache weg in den Bereich der „Welt“, ihrer Sprachkenntnisse und ihres 
Weltwissens geführt hat. 


Auch kleine, elementare Schritte können zu fruchtbaren Einsichten führen. 
Stellen wir uns einen Null-Anfänger vor, dem die Aufgabe zufällt, mit demsel- 
ben Text (d.h. mit den Subtexten) den lexikalischen Bereich der Familie zu er- 
arbeiten und als erstes die fehlenden Begriffe in der folgenden Bildunterschrift 
zu suchen. 


Amore di mamma. Tabu è Ashima Ganguli, moglie di Ashoke e madre di Gogol. Nonostante la 
nostalgia dell'India decide di rimanere negli Usa per il bene dei figli. 
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Die Suche selbst soll ohne jede Instruktion von den Lernenden selbststindig 
definiert werden. Dazu dirfen allerdings aus methodologischen Griinden nur 
sprachliche Elemente verwendet werden, die zuvor bereits als „comprehended 
input“ erfasst worden sind. 

Grundlage für die Arbeit ist die Annahme, dass im Artikel relevante Informa- 
tionen zum Film gegeben werden, die das Verständnis der Bildunterschrift er- 
leichtern (bzw. bestätigen) können. 

Es werden die Konstruktionen di mamma / di Ashoke / di Gogol erkannt, wo- 
durch die mit diesen Ausdrücken verknüpften Elemente amore, moglie und 
madre differenziert wahrgenommen werden können. Lässt man sich von den 
fremden Eigennamen nicht irritieren, dann werden Ausdrücke transparent, die 
sich zu einem Ganzen formen, wobei als isoliertes Element die Konjunktion 
„e“ erkannt wird, die im Kontext als Äquivalent zur deutschen Konjunktion 
„und“ erscheint. 

Die Konjunktion ist damit als funktional eindeutig bestimmtes sprachliches 
Element verwendbar für die Definition der Recherche. 

Gesucht werden soll nach dem männlichen Pendant zu „mamma“, zu „moglie“ 
und zu „madre“. Voraussetzung für die Suche ist die Annahme, dass „Vater 
und Mutter“ als feste Formeln belegt sind und das fehlende Element unmit- 
telbar vor oder nach der Konjunktion „und“ aufscheinen wird. Ja, wir haben 
auch die Vorerwartung, dass die Formel hierarchisch gerichtet, zuerst den 
Mann anführt. Somit suchen wir nach: 


e mamma 


Paget of Go 


stanchezza e dalle emozioni , anche papà e mamma crollano nel sonno . Giovedì 25/11 . Elena 
su delle gigantesche tartarughe in pietra e mamma deve faticare non poco per controllarla 
mangiato ! Restituamo la culla alle hostess e mamma Rita si tene Elena m braccio per tutto 
bambinella nata a Torino da papà romano e mamma torinese ? ) , con un sacco di paraculate 
„ma una famiglia di sei achen | papà e mamma massacrati e quattro bambini usciti coperti 
Sono nata il 3 gennaio 2004 da papà ZEUS 62 e mamma shara 68 . Se volete conoscermi meglio 
solo nel 1998 all'età di 34 anni, sposata e mamma di tre bambini , ha iniziato ad occuparsi 
trovano . Ma andiamo per gradi | quando papà e mamma hanno fatto amicizia , arriva un fotto 
A cena, parkamo . Marito :” Sai , io e mamma ci ricordiamo ancora ... * Noi: " Cosa 
casa della famiglia Darling. F'sera e mamma e papà stanno preparandosi per una festa 
si alza in volo nel cielo . Quando papa e mamma Darkng tornano a casa , trovano i letto 
le è rimasto impigliato tra i capelli, e mamma uccello non è per niente contenta . Bisogna 
autosufficienza , non vogho che pensi che babbo e mamma non simo sempre mezzo passo dietro a lei 
A cena, parkamo . Manto :” Sai, io e mamma ci ricordiamo ancora ...” Noi:” Cosa 


n 


und finden sogleich einen Beleg mit ,papa“ an der vermuteten Stelle, dazu 
aber eine Fülle von weiteren sprachlichen Informationen über Wörter im Kon- 
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text, die Pluralformen sowie Details der Morphologie, die alle in klar definier- 
ten Konstruktionen funktional in Erscheinung treten und mit den dazu gelie- 
ferten Parallelstellen verifiziert, zugleich wiederholt werden können. 

Da „papà“ in Zeile 10 auch rechts von „mamma“ überliefert ist, liegt es nahe, 
auch diese Variante sogleich zu überprüfen. Man erhält dabei einen Einblick 
in die Kraft der Konventionalität, denn die Formel „mamma e“ ist nicht nur 
um den Faktor fünf häufiger dokumentiert, sondern, zumindest im Singular, 
äußerst homogen als Formel „mamma e papä“ überliefert. 


. E sento il profumo di tutti i ragù che mamme e nonne e zie hanno cucinato , per condire 
bimbi possono crescere coni Nonni, con Mamma e Papa, con la nuova moglie di Papà, 
scelta dell' associazione Tornati in Italia Mamma e Papà, telefonano a questa associazione 
arriva il giorno di partire per Albenga, Mamma e Papà non stanno più nella pelle perché 
Agosto 1997, alla nascita pesava 2,7 Kg. Mamma e Papà decisero che quello era " il loro 
foto arriva il 10 giugno 1999 e finalmente Mamma e Papà conoscono il loro bimbo ... che 
preparare il passaporto . Dopo 5 mesi più o meno Mamma e Papà sarebbero dovuti andarlo a prendere 
prendere . A luglio Kristian telefona a casa di Mamma e Papà che subito si allarma : forse qualcosa 
" piccoli cucciolotti " . Nel frattempo Mamma e Papà decidono quale sarà la loro cameretta 
molto più felici . Entreranno nel lettone di Mamma e Papà ? Andranno a svegliarli con un bacio 
possibile. Manca poco cucciolotti , dopo Mamma e Papà non vi lasceranno più |! A metà 
torna con il foglio firmato e timbrato |! Mamma e Papà non credono ai loro occhi | Mamma 
arrivati | Purtroppo così non è stato. Mamma e Papà sono potuti partire solo il 14 maggio 
rifare i passaporti | ... sarà poi vero ? ). Mamma e Papa non ce la fanno più ad aspettare 
sull' aereo | Alla fine l' aereo decolla. Mamma e Papà non stanno nella pelle : domani 
cerca di spiegargli che quei signori sono Mamma e Papà : sono venuti a prendere lui e la 
dalla valigia ( posizionata sul sedile tra Mamma e Papa ) tutto quello che può arraffare 
tempo si rendono conto che " quei due " Mamma e Papà solo li solo per loro , per aiutarli 
forse il più difficile da gestire : ... ma Mamma e Papa si devono abituare . Ora sono genitori 
un bacio a questi meravigliosi bambini da Mamma e Papa: grazie di esistere Ill... e un 


Wer an diesem Punkt die Varianten im Plural erkunden möchte, muss nur die 
Pluralform, die in der ersten Zeile belegt ist, „mamme e“ in das Purase-Fens- 
ter eintippen und schon erscheinen die „nonne e zie“, die „bambini“ aber auch 
die „papà“ im Plural. 

Und weiter mit 


e moglie 


e madre 


und den Umkehrungen. Schon die kursorische Analyse der ersten Seite der je- 
weiligen Suchergebnisse ergibt eine Fülle von brauchbaren Kontexten, For- 
meln, Konstruktionen, Gruppen und den jeweiligen morphologischen Merk- 
malen, die wie auf einem Silbertablett präsentiert erscheinen. Dass die 
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relevanten Beispiel aus einer Fülle von unverständlichen oder weniger interes- 
santen aktiv ausgewählt werden müssen, verstärkt den Effekt der gerichteten 
Aufmerksamkeit. So werden nicht nur lexikalische Einheiten gelernt, dazu 
eine erste syntaktische Struktur von hohem Gebrauchswert, sondern es wer- 
den zugleich Erwartungen aufgebaut, größere Zusammenhänge kommen ins 
Blickfeld und idiomatische Eigenheiten der Zusammenstellungen von Ele- 
menten werden von Anfang an mitgelernt. 


8. Die Freude am Lernen und am Entdecken 

Aus diesen Erfahrungen kann zwar keine stringente Folgerung abgeleitet wer- 
den, aber immerhin eine neue Frage. Könnte es der Fall sein, dass erfolgreiche 
Sprachlernprozesse — auch — damit zu tun haben, dass es den erwachsenen 
Lernenden gelingt, als Grundlage für den Gebrauch der neuen Sprache feste 
Fügungen ins Gedächtnis aufzunehmen und nicht etwa die gleiche Anzahl 
isolierter Wörter, die erst später (nach dem Jusz-In-Case-Prinzip) unter An- 
wendung der gleichzeitig gelernten Grammatikregeln „kreativ“ zu gebrauchs- 
fertigen Einheiten zusammengeführt werden? 

Was, wenn Lernende hingegen in den ersten zwei Wochen Unterricht einige 
hundert dieser „Konstruktionen“ lernten? Jede „formelhafte“ Mehr-Wort-Ver- 
bindung wird im Gedächtnis gespeichert als notwendiger Ausdruck einer ganz 
speziellen Situation, deren Einbettung in das enzyklopädische Wissen des Le- 
sers durch Eigennamen, historische Angaben und dergleichen mehr gewähr- 
leistet ist. Jede Formel wird als sprachlicher Ausdruck, also als Form, wahrge- 
nommen und kann zugleich holistisch einem Moment des täglichen Lebens, 
einer franche de vie zugeordnet werden. 

Diese Beschreibung der „funktionierenden“ Sprache führt zu einem der noch 
ungelösten Probleme des Wortschatzerwerbs beim Erlernen einer Fremdspra- 
che. Wie kommt der analytische Anteil des Lernens ins Spiel, wenn der holis- 
tische stark bevorzugt und sogar antizipiert werden soll? Die Übungsanord- 
nung mit Korpusinstrumenten, die bei holistisch verarbeiteten Konstruktionen 
ansetzt, ist der Versuch, auf diese Frage eine Antwort zu geben. Bei der umge- 
kehrten Lernstrategie, bei der Strategie nämlich, mit dem analytischen Lernen 
zu beginnen und auf diese Weise eine Kompetenz anzustreben, die Schritt für 
Schritt erweitert wird, erscheint der idiomatisch adäquate Sprachgebrauch 
überhaupt nicht am Horizont des Möglichen. Ein Meer von „Grammatikfeh- 
lern“ trennt die Lernenden von diesem Ziel, das — ebenso wie die prosodische, 
die stilistische, die soziolinguistische und die textlinguistische Angemessenheit 
— aus den Curricula ausgeklammert bleibt. 
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Wenn hingegen die idiomatische Sprache an den Anfang des Lernens gestellt 
wird, dann kann die Frage nach der Verbindung von holistischem und analyti- 
schem Vorgehen beim Lernen nicht ungestellt bleiben und verlangt nach einer 
Antwort. Allein dieser Zwang stellt schon einen Gewinn dar, den wir nicht 
ungenutzt lassen sollten. 

Der von verschiedenen Autoren vorgeschlagene Weg, die holistisch gelernten 
Formeln in einem Folgeschritt gleichsam aufzuknacken und dem analytischen 
Lernen als Lernstoff weiterzureichen, wird von Alison Wray entschieden abge- 
lehnt. Holistische Formen der Sprache haben es an sich, dass sie beim „norma- 
len“ Gebrauch durch kompetente Sprecher eben gerade nicht analytisch be- 
handelt werden. Die Idiomatizität stellt gleichsam eine Schutzhülle gegen das 
Analysieren der Einzelteile dar. Beim Lernen in der Schule sollte man nicht 
gegen dieses funktionale Prinzip verstoßen, so Wray, obwohl es nahe liegt, ei- 
nen Kompromiss zu suchen und wie einer der von Wray zitierten Autoren „to 
accept the contradiction between his goal, which is to bring learners to a mas- 
tery of native-like expression, and his means of achieving this, which entails 
non-native-like processing behaviour and a tendency to overgeneralize“. (Wray 
2000: 484) Aber damit ist noch nicht das letzte Wort gesprochen. Im Gegen- 
satz zu Übungsformen, bei denen idiomatische Formeln isoliert in den Unter- 
richt eingebracht werden, erscheinen bei der selbst-verantworteten Korpus- 
Suche die Formeln in einer Vielzahl von Belegen. Schon die Suche nach 
verwertbaren, prototypisch erfahrbaren Belegen führt zu einem Priming-Ef- 
fekt in Hinblick auf den gleich bleibenden Bestandteil der Belege, den Such- 
begriff, der durch Fettdruck hervorgehoben ist und sich daher leicht einprägt. 
Der Suchbegriff wird im Lauf der Arbeit zwischen fünf und zehn Mal be- 
wusst wahrgenommen und hat somit eine hervorragende Chance, schon im 
Lauf dieses ersten Arbeitsschrittes ins Langzeitgedächtnis übernommen zu 
werden. 

Eingespeichert wird dabei die vollständige Konstruktion in ihrer Synthese aus 
Form und Funktion. Dazu kommen Erinnerungen an die thematische Umge- 
bung, an Namen, Orte, Institutionen, Internationalismen, sowie die Funktion 
der Formel im jeweiligen Kontext. Die „Bedeutung“ als gesonderter Bestandteil 
spielt dabei noch keine Rolle. Sie kommt erst in einem zweiten Schritt, nach 
der Wahl des „Prototypen“, der zum Feinverständnis des Ausdrucks führt, zum 
bereits gespeicherten Ausdruck hinzu. 

Während der mit der Suche verbundenen unterschiedlichen Arbeitsschritte 
muss sich der Benutzer der Query-Software darauf besinnen, dass er die Su- 
che nicht wegen der Suche selbst durchgeführt hat, sondern in der Absicht, 
mit Hilfe der Suchergebnisse einen Schritt weiter auf dem Weg des Erlernens 
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der Sprache zu tun. Er muss dafür den Suchausdruck fokussieren und gezielt 
wahrnehmen, sollte ihn vielleicht leise mitsprechen, um die phonetische 
Grundlage für die Verarbeitung im Arbeitsgedächtnis zu schaffen. Er soll den 
Mehr-Wort-Ausdruck in seiner Gesamtheit wahrnehmen und sich auf weitere 
Suchen vorbereiten, die der Stärkung der Sprachaufmerksamkeit dienen. 
Durch den oftmaligen Gebrauch bilden sich Erwartungen und Suchstrategien 
heraus, die ich jetzt als mögliches Lernziel beschreiben möchte. Worin besteht 
die Kompetenz, die bei der Durchsuchung einer umfassenden Sammlung von 
authentischen Texten nach einzelnen Mustern so gute Dienste leistet? Anders 
gefragt. Wonach sucht der erfahrene Nutzer? Das heißt, ein Nutzer, der diese 
Suchen schon sehr oft gemacht hat, tausende von Malen? 

Ich verwende die hier beschriebenen Instrumente und die hier vorgestellte 
Methode beinahe täglich in den Sprachen Deutsch, Italienisch und Englisch. 
In der Analyse des Selbstversuches erkenne ich, dass ich spontan nach Indizi- 
en für den Gebrauchswert der Redewendung suche, deren genaue Bedeutung 
ich mit Hilfe dieses Instruments erkunden möchte. Ich suche also nicht nach 
der „Bedeutung“, wie sie sich etwa als „Übersetzung“ des unbekannten Aus- 
drucks zeigen könnte. Tausendfaches Suchen hat mich geübt gemacht im ra- 
schen Lesen, im Überfliegen der Kurztexte, im Verzicht auf eine rasche Ant- 
wort auf Grund der ersten Zeilen zu Gunsten eines Bildes, das sich nach dem 
Vergleich mit den nachfolgenden Kurztexten ergeben könnte. Das „Aufschie- 
ben des Verstehens“, zu dem nach Nietzsche eine größere „Moralität“ vonnö- 
ten ist, als beim raschen Reagieren auf einen sprachlichen Reiz. Warum habe 
ich nicht ein Wörterbuch gewählt? Vielleicht, weil ich gerade diesen Prozess 
des Vergleichens, des Erprobens von Hypothesen suche und wünsche. Oder, 
weil ich mit dieser Art von Suche gute Erfahrungen gemacht habe. Oder ein- 
fach, weil ich mehr Informationen brauche als die, die ich von einem Wörter- 
buch erwarte, nämlich Informationen über Kontexte, Textsorten, in denen die 
Redewendung überliefert ist, Konnotationen, die bei ihrem Gebrauch mit- 
schwingen und die ihren Gebrauch einschränken. 

Dazu kommt ein Lustgefühl, das im 19. Jahrhundert als „Flanieren“ beschrie- 
ben wurde, und das im Umfeld der Korpus-Recherchen Serendipity-Erfahrung 
genannt wird: Das glückhafte Finden von etwas, wonach man eigentlich gar 
nicht gesucht hat. 


9. Auf den Spuren der Interjektion In Gottes Namen 
Auf allen Stufen der Lerner- und Interimskompetenz können Korpusrecher- 
chen einen Beitrag zum Aufbau und Wachsen der Sprachkompetenz leisten. 
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Die höchste Stufe im Rahmen des Themas Sprache und Schule, stellt der 
Muttersprachunterricht am Gymnasium dar. Hier gibt es junge Menschen, die 
für metasprachliche Aspekte der eigenen Kompetenz und für formale wie 
funktionale Einsichten in das Funktionieren der eigenen Sprache empfänglich 
sind. Die Zeit haben, sprachliche Feinheiten an literarischen Texten zu über- 
prüfen und zu erfahren. Diese Chance muss im Unterricht genutzt werden. 
Die Stärkung der Muttersprachkompetenz in der Südtiroler Schule hat zwei 
ganz konkrete Aufgaben. Es gibt neuralgische Punkte im Kontakt Dialekt- 
Hochsprache und kritische Momente der Sprachkompetenz im Bereich der 
Bildungssprache, wo sich Schwachstellen oft bei phraseologischen Ausdrücken 
zeigen. Solche Schwachstellen sollen nicht überbetont und explizit themati- 
siert werden, aber sie sollen auch nicht verdrängt und vergessen werden. Ich 
möchte hier eine Korpus-Analyse aufgreifen, die seit Jahren zum Standardre- 
pertoire meines Unterrichts in mehrsprachigen Klassen gehört. Es ist dies ein 
sehr aufschlussreiches Beispiel für die enge Verflechtung der Leseakte mit vor- 
gefassten Frames und den Ergebnissen der Korpussuche mit interpretations- 
bedürftigen Ergebnissen. 

Die notwendige Interpretation mit den Gefahren des Uberinterpretierens, des 
falschen Interpretierens und des Missverstehens kann auf Grund des Verfah- 
rens, das auf einer Vielzahl von Daten basiert, sehr effizient in ein didaktisches 
Verfahren pluraler Leseakte überführt werden. Die Einsichten über Defizite 
und Schwachstellen der Sprachkompetenz der Schülerinnen können unausge- 
sprochen in diese Arbeit einfließen und auf Lernstrategien abzielen, die genau 
diese Defizite beheben helfen ohne sie plakativ hervorzuheben. 


Ausgangspunkt ist ein Text von Hans Magnus Enzensberger. In Enzensber- 
gers Der Untergang der Titanic, einem Gedichtzyklus aus 33 Gesängen, finden 
sich 16, zum Teil stark fachsprachlich geprägte, Einschübe oder Exkurse, wie 
sie in Enzensbergers Lyrik so typisch sind. Der zweite dieser Einschübe trägt 
den Titel Verlustanzeige (Enzensberger 1978: 65) und setzt stereotype sprach- 
liche Elemente in Verbindung zu Interjektionen. 


Verlustanzeige 

Die Haare verlieren, die Nerven, 
versteht ihr, die kostbare Zeit, 
auf verlorenem Posten an Höhe 
verlieren, an Glanz, ich bedaure, 
macht nichts, nach Punkten, 


unterbrecht mich nicht, Blut 
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verlieren, Vater und Mutter, 

das in Heidelberg verlorene Herz, 
ohne mit der Wimper zu zucken, 
noch einmal verlieren, den Reiz 

der Neuheit, Schwamm drüber, 

die bürgerlichen Ehrenrechte, aha, 
den Kopf, in Gottesnamen, den Kopf, 
wenn es unbedingt sein muß, 

das verlorene Paradies, meinetwegen, 
den Arbeitsplatz, den Verlorenen Sohn, 
das Gesicht, auch das noch, 

einen Backenzahn, zwei Weltkriege, 
drei Kilo Übergewicht verlieren, 
verlieren, immer nur verlieren, auch 
die längst verlorenen Illusionen, 

na wenn schon, kein Wort 

über die verlorene Liebesmüh, 

aber woher denn, das Augenlicht 

aus den Augen, die Unschuld 
verlieren, schade, den Hausschlüssel, 
schade, sich, gedankenverloren, 

in der Menge verlieren, 

unterbrecht mich nicht, 

den Verstand, den letzten Heller, 
sei’s drum, gleich bin ich fertig, 

die Fassung, Hopfen und Malz, 

alles auf einmal verlieren, 

wehe, sogar den Faden, 


den Führerschein, und die Lust. 


Auf den ersten Blick ist die Struktur des Textes einsichtig. Stereotype Formeln 
und feste Syntagmen mit dem Verbum „verlieren“ werden zusammengestellt 
und durch sogenannte „sekundäre“ Interjektionen oder Diskurs-Marker in der 
jeweiligen Sprechsituation verankert. Neu ist gerade die Kombination von 
idiomatischen Formeln und Interjektionen. Enzensbergers Text zwingt den 
Leser gleichsam, jede Interjektion in ihrer virtuellen Situation zu verstehen 
und daher eine passende Situation zur jeweiligen Aussage hinzuzudenken. 
Dadurch werden auch die Phraseologismen in ihrem situativen Gebrauchs- 
wert erfahrbar: „die Nerven verlieren“, „kostbare Zeit verlieren“. Ein kleines 
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„Frame-fülle-dich-Spiel“ kann beginnen, bei dem die Schülerinnen und Schü- 
ler Situationen suchen und (er)finden sollen, bei denen die einzelnen Frames 
in persönlich erfahrenen Aktualisierungen sprachlich realisiert werden. 
Interjektionen entfalten ihre Funktion im Raum des Sprechaktes auf sehr un- 
terschiedliche Weise. Sie verbinden kognitive und affektive Aspekte und kön- 
nen, in verschieden starker Gewichtung alle drei Funktionsklassen des Bühler- 
schen Modells betreffen, also sprecher-, adressatenbezogen oder stärker auf die 
Sachverhalte bezogen sein. Diese Variabilität kann beim Aktualisieren der 
Ausdrücke aus Enzensbergers Text nuanciert erfahren werden. 

Die jeweils konkreten Sprechsituationen, die von Enzensbergers Textabschnit- 
ten verlangt werden, sind aber nicht vorgegeben, wie auch die kontextuelle Be- 
deutung der einzelnen Interjektionen des Textes einen weiten Spielraum an 
Sprachgebrauch abdecken kann. (Reisigl, 1999) 

Zu diesen Erfahrungen mit dem Text kommt sodann die Feinanalyse der zen- 
tralen Stelle, die beim ersten Lesen wahrscheinlich gar nicht auffällt. Wie ge- 
nau Enzensberger die Abfolge von Verlustanzeige und Einspruch der Stimme 
der Interjektionen komponiert, sieht man an der Abfolge der Ausdrücke „den 
Reiz der Neuheit verlieren — Schwamm drüber“ und „das verlorene Paradies — 
meinetwegen“;, die Stimme bleibt also keineswegs unbeteiligt als Ausdruck 
stereotyper Kommentare. Das provozierende „meinetwegen“ als Antwort auf 
den Verlust des Paradieses dient als Signal für die persönliche Einstellung zu 
den Situationen, die der Text mit seinen rudimentären Sprachelementen evo- 
ziert. Dieses deutliche Signal steht nach drei Interjektionen, deren Funktions- 
bestimmung ebenfalls dem Leser überantwortet ist — nach einem enigmati- 
schen „aha“, einem unvertrauten „in Gottesnamen“ und dem keineswegs 
harmlosen „wenn es unbedingt sein muss“: 


die bürgerlichen Ehrenrechte, aha, 
den Kopf, in Gottesnamen, den Kopf, 


wenn es unbedingt sein muß, 


Werfen wir zuerst einen Blick auf die Interjektion in Gottesnamen, die wohl 
nicht alle deutschen Sprecher im aktiven Wortschatz haben. Die Frage des 
Gebrauchs stellt sich also in der Form: in welchen Kontexten Sprecher, die in 
Gottesnamen überhaupt als Interjektion verwenden, den Ausdruck tatsächlich 
verwenden. 

Es gibt mehrere, nebeneinander bestehende Gebrauchsformen von in Gottes 
Namen, die sich auch durch unterschiedliche prosodische Realisierungen des 
Syntagmas deutlich voneinander abgrenzen lassen. Eigentlich handelt es sich 
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um eine Art Homonymie von zwei klar getrennten Formen, von denen nur 
eine als sekundäre Interjektion gelten kann. Die Form mit voller Bewahrung 
der Wortsemantik von „Gott“ und „Namen“ erfüllt ja gerade nicht die Bedin- 
gung für die Zugehörigkeit zur Klasse der sekundären Interjektionen, die da- 
durch definiert ist, dass die Wortgruppe auf dem Weg zur Interjektion ihren 
ursprünglichen wörtlichen Sinn eingebüßt hat. Also sind die folgenden Bei- 
spiele aus dem Mannheimer Corpus nicht als Interjektionen zu werten: 


Mit den Worten „Wir wollen in Gottes Namen gießen“ läßt er den Guß beginnen. 
Vorbild für den Funk in Gottes Namen ist Radio Maria Italien. Vor sieben Jahren gegründet, ist 
der Sender nach RAI 1 der zweitstärkste im Land. 


Bei dieser Verwendung wird das Syntagma mit steigendem Melodieverlauf 
gesprochen und unterscheidet sich daher deutlich von den Fällen der Interjek- 
tion, die nicht mit dem Hauptton versehen ist und die durch eine fallende In- 
tonationskontur und Deakzentuierung von „Namen“ gekennzeichnet ist. 
Vielen, aber keineswegs allen Sprechern des Deutschen sind diese beiden For- 
men vertraut. Werden Muttersprachler des Deutschen aufgefordert, im Kon- 
text einer didaktischen Demonstration Beispiele für diese Interjektion anzuge- 
ben, dann geben sie in großer Mehrzahl zuerst ein Beispiel für die wörtliche 
Verwendung des Syntagmas. Das ist ein schönes Beispiel dafür, wie der Beob- 
achter den Gegenstand seiner Beobachtung durch die Fragestellung beein- 
flusst und bereits vorentscheidet, denn die mündlich vorgebrachte Aufforde- 
rung, ein Beispiel anzugeben, versieht das Syntagma in Gottes Namen mit 
starker Betonung und steigender Intonationskontur, wie sie bei Zitaten üblich 
ist, und gibt dem Hörer das akustische Signal, nach einem Syntagma mit stei- 
gendem Ton zu suchen. Die Antwort wird vom Priming der Frage bestimmt, 
die bereits ein bestimmtes prosodisches Muster vorgibt. 

In vielen Fällen, die mir untergekommen sind, stutzt die Informantin aber 
gleich nach ihrem Beispielsatz und sucht nach einem weiteren Beispiel, das ih- 
rer Intuition über den Gebrauch der Interjektion „in Gottes Namen“ eher ent- 
spricht als der erste Ausdruck, den sie gerade als Beispiel angegeben hat. Die 
zweite Aktualisierung gibt dann ein Beispiel für die Interjektion mit der ihr 
eigenen Semantik und der für sie typischen prosodischen Realisierung. 

Die ersten authentischen Beispiele, die ich einer Kollegin abverlangt habe, zei- 
gen die zwei unterschiedlichen prosodischen Realisierungen des Syntagmas, 
beim ersten Beispiel mit starker Betonung, beim zweiten Beispiel hingegen er- 
hält das Verb den Haupton und die Interjektion ist deakzentuiert. 
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Lass mich in Gottes Namen in Frieden! 


Dann geh’ halt in Gottesnamen. 


Die Kollegin hat die zwei Beispiele — auf meine Bitte hin — aus einer für sie 
erfahrbaren vorgestellten Situation heraus laut gesprochen, und nach einigem 
Zögern waren die zwei Intonationsmuster deutlich differenziert. 

Auch der Muttersprachler hat also Anlass, sich seiner Sprachkompetenz zu 
vergewissern, und die experimentellen Bedingungen stellen bei dieser Kontrol- 
le schon eine erste, nicht zu übersehende Hürde dar. 

Bei dieser gesteuerten und kontrollierten Reaktion auf eine Aufgabe kann 
man gleichsam am eigenen Leib die Erfahrung sprachlicher Kommunikation 
in Form von Prototypen erleben. Wir haben keine genaue Vorstellung von der 
Bedeutung des Ausdrucks in Gottes Namen, aber wir haben eine Vorstellung 
von Situationen, in denen der Ausdruck verwendet werden kann, wenn ihn je- 
mand verwendet. Und wir erkennen auch den semantisch vollen Ausdruck als 
solchen. Die Vorstellung von erinnerten oder simulierten Situationen ist indi- 
viduellen Schwankungen unterworfen, die bei diesem Beispiel einen großen 
Spielraum abdecken. Aber Sprecher, denen beide Formen vertraut sind, haben 
das Gefühl, dass in Gottesnamen in den ihnen gerade präsentierten Beispielen 
richtig verwendet wird. 

Die beim normalen Sprachgebrauch unzugängliche Erinnerung an die Inter- 
jektion wird durch den literarischen Text aus dem Gedächtnis hervorgerufen 
und wieder in den aktiven Wortschatz aufgenommen. Dieser Prozess kann 
durch die gezielte Suche nach Beispielen gefördert werden. 

So viel zu den Studierenden, denen die Interjektion bekannt ist. Es gibt Dia- 
lektsprecher, denen die prosodische Gestaltung mit dem Akzent auf NAmen 
so unvertraut ist, dass es ihnen schwer fällt, diese lautliche Form auch nur 
nachzusprechen. Spontan erhält immer GOTtes den Hauptton des Ausdrucks. 
Andere Studierende wiederum erlangen erst nach mehreren Hinweisen Zu- 
gang zur Erinnerung an die Form mit Betonung auf NAmen. Und es sind im- 
mer wieder Hinweise auf konkrete Sprechsituationen, der konkrete Hinweis 
auf die Großmutter, den Großvater oder andere ältere Mitglieder der Familie, 
die zum Aha-Erlebnis führen. Ja, sie erinnern sich an diese Variante und sind 
sogleich imstande, die Funktion des Ausdrucks zu rekonstruieren: „Wenn je- 
mand etwas ungern tut oder widerwillig ein Zugeständnis macht...“. 

Die Erfahrungen mit spontan geforderten Beispielsätzen zu in Gottes Namen 
zeigen, wie schwierig es ist, den eigenen Sprachgebrauch in einer kontextfreien 
Situation zu rekonstruieren. Man erkennt rasch, dass es nicht ganz einfach ist, 
authentische Beispiele zu finden und sie situationsadäquat laut einer Gruppe 
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von Zuhörern vorzusprechen. Diese Erfahrungen legen es nahe, den Lehrper- 
sonen Anregungen für die Stundenvorbereitung zu geben. Korpusrecherchen 
bieten sich als gezielte Materialsammlung dafür an. (vgl. McCarthy, 2004) 
Was geschieht nun beim Lesen von Enzensbergers Text? Die Leser „müssen“ 
die Interjektion verstehen, sie sind daher „gezwungen“, eine Situation zu kon- 
struieren, in der die Verwendung der Interjektion sinnvoll erscheint. Was für 
eine Situation ist das, und welcher Prototyp von in Gottes Namen wird dabei 
aktiviert? Diese Entscheidung steht und fällt bereits mit dem Verständnis des 
idiomatischen Ausdrucks „den Kopf verlieren“, der den engeren Kontext der 
Stelle darstellt. Das Verständnis dieses zweideutigen Ausdrucks wird aber 
ebenfalls vom Kontext gesteuert, so dass wir hier einen Paradefall für das von 
Nietzsche geforderte „sorgfältige, rücksichtsvolle Lesen“ haben. Ein Lesen mit 
„offen gelassenen Türen“, Türen, Zugängen zum Verstehen, die nicht auf einen 
Schlag zugeworfen werden, sobald wir eine erste Hypothese des Verstehens 
gebildet haben (vgl. Drumbl, 2003b, 2007b). Die gegenseitige Bedingung der 
beiden Ausdrücke verlangt nach einem Ausgleich der jeweiligen constraints ge- 
genüber dem Kontext. Die Bedeutungen müssen für beide Fälle und in beide 
Richtungen hin passen. Die Bedeutung der Zeile wird gleichsam unter dem 
Druck der constraints ausgehandelt. 


den Kopf verlieren (unüberlegtes Handeln) 
den Kopf verlieren (getötet werden) 
in Gottes Namen (den Namen Gottes anrufend) 


in Gottes Namen (Interjektion: unter Druck gegebenes Einverständnis) 


Dieser Prozess des Erprobens von kompatiblen Bedeutungen, der hier sche- 
matisch vorgeführt wird, stellt den Kern der Text- und Diskurskompetenz in 
der Muttersprache dar. 

Lernen können wir diese Kompetenz als Sprecher der Zweitsprache — auch — 
durch Beobachtung von gelungenen Fällen ihrer Realisierung in den jeweils 
spezifischen Kontexten. Für jeden denkbaren Sprachgebrauch gibt es Präze- 
denzfälle, an denen man die gerade anstehende Aufgabe messen kann. 

Das „Glücken“ der eigenen Sprechakte ist eingebettet in Sprechakte anderer 
Teilnehmer der Sprachgemeinschaft, geglückte, wie misslungene Sprechakte, 
von denen wir — in Ausnahmemomenten gesteigerter Aufmerksamkeit — eini- 
ge wenige wahrnehmen. Die Begegnungen mit literarischen Texten sind sol- 
che Ausnahmefälle. 

Enzensberger hat den Text geradezu auf die Interjektion „in Gottesnamen“ 
hin komponiert. Die polemisch aktuelle Anklage, einem alten Ausdruck an- 
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vertraut, der nur mehr wenigen Mitgliedern der Sprachgemeinschaft im akti- 
ven Wortschatz gelaufig ist. 

Enzensberger ist die Interjektion seit seinen Studienjahren vertraut und es 
scheint, als habe er ein halbes Leben lang darauf gewartet, ihr den gebühren- 
den Platz in einem eigenen Werk geben zu können. Ambivalent als Anrufung 
höchster moralischer Instanzen in Momenten sprachlichen Handelns, das auf 
schändlichste Art und Weise den moralischen Grundlagen der eigenen Kultur 
widerspricht. Diese Qualität der Interjektion im Gedicht wird schlagartig klar, 
wenn man im Mannheimer Korpus auf folgenden Beleg aus dem Zürcher Ta- 
gesanzeiger stößt: 


Deren heimliche Moral: Männer Gottes soll man nicht hinrichten. Die andern darf man, wenn es 


denn in Gottes Namen sein muss. 


Das ist genau die Bedeutung der Interjektion in Enzensbergers Text. Enzens- 
berger hat dem idiomatischen Ausdruck ein kleines Denkmal gesetzt, hat den 
Ausdruck auf ein Podest erhoben, wo er deutlich sichtbar, vom Kontext fein- 
stimmig abgesichert, sein in der Alltagssprache tief verwurzeltes Potential zur 
Entfaltung bringt. Wer diesen Ausdruck in seiner eigenen Sprache kennt, weil 
er in den Situationen, in denen er funktional auftreten kann, tatsächlich ver- 
wendet wird, ist durchaus imstande, genau diese Funktionalität auch im litera- 
rischen Kontext wahrzunehmen. Den Leser trifft dann die volle Macht der 
unvorhergesehenen Verbindung der Interjektion, bei der die Anrufung Gottes 
mitwirkt, mit der Zustimmung zum Töten eines Menschen. 

Konflikte spielen im Alltagsgebrauch der Interjektion eine große Rolle. Dazu 
einige Belege aus aktuellen und oft politisch brisanten Kontexten: 


Gadamer: „Geht in irgendein anderes Studienfach oder, in Gottes Namen, werdet ein gebildeter 
Taxichauffeur!“ 

Es ist doch ein Schaden für unsere Demokratie, wenn ein Teil der Wohnbevölkerung abseits steht. 
Wenn man dieses Defizit nur mit einem Sonderangebot beheben kann, warum soll dann in Got- 
tes Namen die doppelte Staatsbürgerschaft nicht ein solches Sonderangebot sein? 

„Man muß doch mal vergleichen, was die Buche den Menschen bringt und was der geplante Neu- 
bau bringt“. Für Marianne Götze ein klarer Fall: „Fällt in Gottes Namen den Baum!“. „Ich bin 
dafür, daß die Buche stehen bleibt“, sagte dagegen Günter Ehrenfried klipp und klar. 

Nun könnte man sagen, die CDU soll sich nicht so anstellen mit ihren Prinzipien und aus 
Opel in Gottes Namen dann eben eine Art zweiten Volkswagen machen. Das wirkliche Problem 
ist aber, dass nach wie vor niemand weiß, ob und wie Opel überhaupt zu helfen ist. 


online/2009/14/opel-merkel_dwdsddc.xml 
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Der Kontext wird transparent im Moment, in dem die vertraute Redewen- 
dung als vertraut erkannt wird und zu vertrauten Kontexten in Beziehung ge- 
setzt wird, die vom literarischen Kontext auch weit entfernt sein können. 

In solchen Momenten kann ein Lernprozess stattfinden, der eine Wendung 
auf Dauer ins Gedächtnis einprägt. So etwas bewirkt die Stelle im Gedicht 
von Enzensberger. Er selbst hatte die Interjektion an einer literarisch auf 
höchstem Niveau markierten Stelle gefunden, und dazu in einem höchst uner- 
warteten, wenn nicht sogar unpassenden Kontext: „Nun gehe in Gottes Na- 
men, du wunderlich liebe verfluchte Seele, fort, fort!“ Eine Stelle bei Brentano, 
die Enzensberger seinerzeit in seine Brentano-Anthologie aufgenommen hat, 
und die ihm wohl schon als Student, während der Arbeit an seiner Doktorar- 
beit zur Poetik Brentanos aufgefallen war. 

Es ist die Abschiedsszene zwischen dem Erzähler und der jungen Perdida: 


„Du verwirrtes satanisches Geschöpf! Nun packe dich!“ — „Sieh, der Morgenstern, gleich wie ein 
Held, will uns den Tag verkünden, leb wohl! Leb wohl! Was wirst du nun machen, wenn du die 
kleine schöne liebe verlorene nichtsnutzige Perdida nicht mehr hast?“ — „Noch eins, Mädchen! 
Wer ist dann schuld an deiner verdammten Seele?“ — „Ei, das Katholischwerden der verzwickten 
Dichterin, die sich hier für eine Gräfin ausgiebt, sie lügt und ziert und schraubt, da muß man es ja 
lernen, und doch hat sie mich weggejagt, weil ich keinen Sinn für höhere Kunst habe, aber sie war 
eigentlich eifersüchtig auf mich — ho, ho!“ — „Nun gehe in Gottes Namen, du wunderlich liebe 
verfluchte Seele, fort, fort!“ — und somit lief die Eidechse mit dem Hündchen und ihrem Raub 
singend ab: „Ich bin ja so geschwinde als ein Mädchen kann sein!“ — Ich aber blieb zurück, und als 
ich das kleine Kreuz, das sie mir zurückgelassen hatte, ergriff, durchdrang mich eine namenlose 
Rührung, ich war fest entschlossen, Rom auf einige Zeit zu verlassen, wenige Kleider packte ich 
zusammen, steckte meinem Hausherrn einen Brief an die Türe, und begab mich zu meinem 


Freunde Bonascopa. (S. 247) 


Spielerisch leicht findet die Interjektion bei Brentano ihren Ort. Aber ebenso 
natürlich und unaufdringlich erscheint sie an vielen Orten in literarischen 
Texten: von den Wahlverwandtschaften, „Nimm Ottilien, laß mir den Haupt- 
mann, und in Gottes Namen sei der Versuch gemacht!“ bis zum kaum ver- 
nehmbaren „in Gottes Namen“, mit dem im „Rosenkavalier“ die Marschallin 
Octavian ins Liebesglück mit Sophie entlässt. 
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Die Korpusrecherchen zu „in Gottes Namen“ haben paradigmatischen Cha- 
rakter. Der Ausgangspunkt der Suche nach Belegen war cin prignantes litera- 
risches Beispiel, das die Interjektion „fragwürdig“ werden ließ. Die Belege aus 
der ersten Suche (im Mannheimer Korpus) brachten einige klar erkenntliche 
Parallelfalle zum Gebrauch bei Enzensberger, von Goethe bis zu Gadamer, 
mit dem aufschlussreichen Beleg, bei dem vom Erschießen von Gefangenen 
die Rede ist. Dazu kamen die Belege, die auf den ersten Blick als inkompati- 
bel zur Bedeutung der Interjektion zu erkennen waren, mit der starken Beto- 
nung auf GOTtes und der nicht-phraseologischen Struktur der Mehr-Wort- 
Gruppe. Jemand beginnt etwas und ruft den Namen Gottes an. 

Die Erkenntnis, dass in der Fülle der Belege zwei deutlich voneinander getrennte 
Muster aufscheinen, leitet den Blick des Suchenden sodann, die Belege nach den 
Kategorien der Zugehörigkeit zu diesen zwei Mustern zu ordnen. Da das Inter- 
esse der Interjektion gilt, wird die Gruppe der wörtlich zu verstehenden Äuße- 
rung, aber nur am Rande wahrgenommen. Die Suche ist ein Aussortieren der 
nicht pertinenten Belege nach dem Merkmal +- Interjektion = +- Deakzentuie- 
rung von „Gottes“ — bei gleichzeitiger Überprüfung des jeweiligen Kontextes. 
Diese Suche kann auch mit Google durchgeführt werden, wo die Snippets, wie 
so oft, ihre Aussagekraft unter Beweis stellen. Es ist mit ihrer Hilfe tatsächlich 
möglich, die Belege nach diesen zwei Gruppen eindeutig zu ordnen. 

Bei dieser Suche entsteht noch eine Restgruppe, das sind die Belege, die in 
keine der beiden Gruppen passen. Für den Suchenden besteht keine Veranlas- 
sung, sich näher mit diesem „Rest“ zu beschäftigen, obwohl die Mehrheit der 
Belege dieser dritten Gruppe angehört. Widmet man sich hingegen diesen 
Beispielen, dann zeigen die Korpusbelege schr schön die Auflösung der Op- 
position zwischen den beiden gerade erkannten Typen, die sich dem ordnen- 
den Blick verdanken, zugunsten einer größeren Vielfalt von Gebrauchsformen 
und Typen. Auffallend sind die Übergänge zwischen den Mustern, sowie das 
Blending der Interjektionen „In Gottes Namen“ und „Um Himmels willen“: 


Alle drei waren bedeutende, international respektierte Gelehrte. Was in Gottes Namen konnte 
sie veranlassen, Hitler öffentlich, begeistert und mit wenig Zurückhaltung zu unterstützen? 

Viele sowjetische Soldaten waren, wenn sie auf deutsche Zivilisten trafen, von unbändiger Wut 
erfüllt, die teils ihren persönlichen Leidensgeschichten entsprang, teils der Brutalität des totalen 
Krieges gegen die Sowjetunion. Diese Wut wuchs, je tiefer die Rote Armee nach Deutschland 
vorstieß, das selbst in der letzten Kriegsphase noch reich erschien im Kontrast zu den ärmlichen 
Verhältnissen, aus denen viele Rotarmisten kamen: »Warum in Gottes Namen haben sie uns 
überfallen? Wir besaßen doch überhaupt nichts, was sie uns hätten nehmen können!« 


2008/44/ Anonyma_dwdsddc.xml 
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So auch bei Thomas Mann, mit deutlich ironischem Unterton: 


Die sieben Tage einer Woche würden dazu nicht reichen, und auch sieben Monate nicht. „Es wer- 


den, in Gottes Namen, ja nicht geradezu sieben Jahre sein“. 


Damit ist ein drittes konsistentes Muster nachgewiesen, und zwar eine zweite, 
von der konzessiven deutlich zu unterscheidende Interjektion. Bei diesem Ge- 
brauch als Interjektion erhält GOTtes den Hauptton und die Interjektion ist 
gleichbedeutend mit „um Himmels willen“. Die konzessive Bedeutung der 
teilweise homonymen (d. h. mit unterschiedlicher prosodischer Gestaltung) 
Interjektion fehlt völlig. 

Widerspricht dieser Befund der Ausgangsfrage, der Frage, ob Korpusrecher- 
chen im Sprachunterricht eine Rolle spielen können? Ich glaube, diese Frage 
kann man mit nein beantworten. Der unerwartet hohe Grad an Komplexität 
der Beleglage, kann zwar dazu verführen, die Suche an dieser Stelle abzubre- 
chen, er könnte aber auch zum Anlass werden, die Analyse der Interjektion zu 
vertiefen. 

Abgesehen von der literarischen Verwendung bei Enzensberger, die imstande 
ist, ein verschüttetes Erbe freizulegen und das Gefundene wie in einem Mau- 
soleum der authentischen Sprache zu bewahren, ist die Erkenntnis der Über- 
gänge, der „innovativen“ Gebrauchsmuster ein sehr effizienter Zugang zur Er- 
kenntnis, wie unsere Sprache tatsächlich funktioniert. Selbst die vorgefertigten 
Ausdrücke werden nicht als reine Fertigteile überliefert, sie stehen nicht iso- 
liert in der Welt, sie sind eng eingebettet in ein Geflecht von Kontexten und 
Gemeintem, von stilistischen und funktionalen Constraints, bis hin zu idiosyn- 
kratischen Momenten des sprachlichen Handelns. 

Und sie sind Veränderungen unterworfen. Diese Realität des Sprechens zu er- 
kennen, und die dazu gehörigen sprachlichen Mittel, die optimiert sind für ge- 
nau diese Art des Sprachgebrauchs, ist die beste Schulung, die ich mir für mei- 
ne eingeschüchterten Studierenden des Deutschen wünschen kann. Habt 
keine Angst, der neuen Sprache zu begegnen, ist die Botschaft dieser Korpus- 
belege, in sie einzutauchen, euch von der Sprache überfluten zu lassen, alles 
fließt, es ist aber auch mit starken Wurzeln verankert. Diese Verankerung 
wahrzunehmen, ist ein entscheidender Moment im Lernprozess des Neuen. 
Die sprachlichen Mittel werden von Menschen gebraucht, die mit der Sprache 
etwas „anfangen“, die mit Hilfe der Sprache handeln. 

Und diese Formen, die Gebrauchsformen, verändern sich. Die Überlieferung 
der Interjektion „in Gottes Namen“ zeigt die großen Schwankungen im Ge- 
brauch, quantitativ und qualitativ, bis hin zur Koexistenz von zwei homony- 
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men Konjunktionen mit unterschiedlicher prosodischer Gestaltung, unter- 
schiedlicher Bedeutung aber auch mit divergierenden Konnotationen des 
Gebrauchs, eine im persönlichen, privaten Bereich, im Gespräch mit vertrau- 
ten Menschen, die andere in literarisch markierter, oft auch öffentlicher Rede 
belegt. 

Besonders auffällig wird die Interjektion schließlich beim Übersetzen. In der 
neuen Suchmaschine /inguee.de wird als Übersetzung für „In Gottes Namen“ 
der englische Ausdruck „For goodness sake“ angegeben. Wenn man dann aber 
diesen englischen Ausdruck als Suchobjekt eingibt, erhält man kein einziges 
Ergebnis mit „In Gottes Namen“! Die Suche mit parallelen Texten verlangt 
also immer den Eingriff des bewusst agierenden und kundigen Lesers. Der 
Leser lernt beim Analysieren der Ergebnisse. Unter den Ergebnissen der Su- 
che nach „In Gottes Namen“ finden sich auf der einzigen Seite aus EU-Do- 
kumenten zwei schöne Belege der konzessiven Interjektion, dazu Belege für 
die Bedeutung „Um Himmels willen“: 


Wenn es wirklich ein Problem mit dem Gebäude gäbe, dann müssten wir halt in Gottes Namen 
auf die andere Seite des Flusses, ins Palais de ‘Europe, ziehen. 

Dann ändern wir in Gottes Namen eben Novelfood, dann lassen wir die drei sachlichen Kriterien 
fallen, und immer dann, wenn irgendwo in der Kette ein genetisch veränderter Bestandteil auftritt, 


wird etikettiert! 
Aber: 


Was in Gottes Namen hat das alles denn mit dem Lissabon-Prozess zu tun? 


Vielleicht ist es diese Parallelität, die schließlich dazu geführt hat, dass die Be- 
lege mit der Zeit an Zahl drastisch abnehmen. Die Erinnerung an typische 
Gebrauchssituationen verblasst, der Ausdruck wird vergessen. 
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Auch die Lernenden der Zweitsprache haben an diesen Prozessen der Verän- 
derung, des Vergessens Anteil. Sie treten an die Schwelle der fremden Sprach- 
gemeinschaft und begegnen der neuen Sprache nicht als einem unveränderba- 
rem monolithischen Block, sondern als Korpus von Äußerungen und 
Sprechakten in fieri, zu dem sie bald selbst etwas beitragen werden. 
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Abstract 

Neuere Beiträge zur Wortschatzvermittlung im gesteuerten DaF-Unterricht gehen 
über die Wortgrenze hinaus und setzen als Grundelement der zu erlernenden Sprache 
Konstruktionen (Goldberg) und den Ausdruck als Kristallisationspunkt für Kombinations- 
und Selektionspräferenzen (Feilke) an. Dieser neue Blick auf die Sprache kann mit Hilfe 
von Korpusrecherchen in den Sprachunterricht eingebracht werden. Das umfassende 
Ziel, den gesteuerten Spracherwerb als Data Driven Learning mit Hilfe von Korpusre- 
cherchen auf eine neue Grundlage zu stellen, wurde nicht erreicht und die bisher vor- 
gelegten Erfahrungsberichte betreffen kaum mehr als Nischenangebote im Panorama 
des Fremdsprachenunterrichts. In diesem Beitrag werden positive didaktische Erfah- 
rungen mit Korpora vorgestellt und analysiert, die in der dreisprachigen Arbeitsumge- 
bung der Freien Universität Bozen entstanden sind. Gesteuerte Korpusrecherchen mit 
einem gemeinsamen Interface für Korpora in den drei Arbeitssprachen Deutsch, Italie- 
nisch und Englisch erweisen sich dabei nicht nur als ansprechendes Angebot für fort- 
geschrittene Studierende, sondern auch als Werkzeug für die Erarbeitung einer grund- 
legend neuen Haltung der italienischen Studierenden gegenüber dem Ziel des 
Erlernens der Zweitsprache Deutsch und allgemein, für den Umgang mit Sprachen in 
Situationen des täglichen Sprachkontakts und des Schreibens in der Zweitsprache. 


Einleitung 

Das Interesse, das Lehrpersonen und Lernende den großen Sammlungen von 
Texten entgegenbringen, ist nur zu einem ganz geringen Teil identisch mit 
dem Interesse der wissenschaftlichen Erforschung dieser Sammlungen nach 
korpuslinguistischen Fragestellungen und mit korpuslinguistischen Methoden. 
Ein ausgewiesener Spezialist solcher Untersuchungen, Stefan Gries der Uni- 
versity of California, Santa Barbara, schreibt dazu: 


By its very nature, corpus linguistics is a distributional discipline. In fact, it has been argued that 


corpora as such contain nothing but distributional frequency data. (Gries 2010:5) 


Wenn man vom Interesse an der reinen Frequenz von Mustern, Kollokationen 
und Konstruktionen absieht, was für eine erkenntnisleitende Fragestellung 
verbleibt dann überhaupt und aus welchem Grund sollte man sich mit Korpo- 
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ra im Unterricht befassen? In einem Forumsbeitrag hat Adam Kilgariff, der 
die äußerst benutzerfreundliche SketchEngine entwickelt hat, ein resignieren- 
des Resumee gegeben: 


Concordances are too tough for learners. So DDL has not taken off. After 20 years, it remains a 


tiny minority interest. 


Diese Feststellung steht wie eine unbequeme Barriere vor der eigenen Arbeit 
mit Korpora im Sprachunterricht und fordert zu grundlegenden Uberlegungen 
heraus. Eine Konsequenz, die aus der Komplexität von Korpusrecherchen ab- 
geleitet wird: Korpusinstrumente gehòren nur in die Hand von sehr fortge- 
schrittenen Lernenden, sagt man, oder von Muttersprachlern, die sich vorge- 
nommen haben, feinste stilistische Varianten auszuloten. Aus der Gesamtmenge 
von distributionellen Daten werden also gleichsam Nischen-Daten herausgefil- 
tert, die sprachliche Phinomene an der Grenze der Grammatik und Stilistik 
betreffen und die selbst in großen Textsammlungen, wenn man nach Textsor- 
ten und Registern differenziert, nicht in großer Zahl dokumentiert sind. 

Im Sprachunterricht sind also nur Einzelfälle relevant, die nach ganz be- 
stimmten Kriterien der Relevanz aus der Masse der Gesamtbelege herausge- 
filtert werden. 

Das Thema dieses Aufsatzes ist die eng begrenzte Methode der Korpusana- 
lyse in genau dieser Hinsicht. Ich berichte über didaktische Erfahrungen mit 
Korpora im DaF-Unterricht mit ganz bestimmten Kategorien von Lernen- 
den, aber die Arbeit mit Korpusrecherchen wird vor den Hintergrund einer 
Neubestimmung didaktischer Prioritäten auf dem Gebiet des Wortschatz- 
und Grammatikunterrichts gestellt. Die ausgrenzende Definition von Kor- 
pusanalysen, die Gries als anerkannte Wahrheit ausspricht, hat nämlich sehr 
wohl eine Verbindung zum Sprachunterricht, und zwar über die Brücke des 
dem Unterricht zugrunde gelegten Grammatikmodells. Zu den strukturalis- 
tischen Modellen, die großes Augenmerk auf die kleinsten Einheiten legen, 
ist jüngst die Definition der Sprachbefähigung im engen Sinn gekommen 
(Hauser, Chomsky, Fitch 2002), die in der Bestimmung mündet: In fact, we 
propose in this hypothesis that FLN comprises only the core computational mecha- 
nisms of recursion as they appear in narrow syntax and the mappings to the inter- 
faces. Aus dieser Sicht kann ein Bild der Sprachbefähigung abgeleitet werden, 
das den Umgang mit Sprachen bis hinein zur Bestimmung von Übungsstra- 
tegien zum gesteuerten Erwerb der Zweit- und der Fremdsprache führt. 
Dieses Bild scheint heute allerdings vielen Sprachwissenschaftlern und dem 
Großteil der Sprachdidaktiker und der Lehrpersonen zu eng gefasst. 
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Die Bestimmung eines Kernstücks, core, sprachlicher Funktionalität und die 
Gleichsetzung dieses Kerns mit der Syntax in engem Sinn, führt zum Aus- 
schluss all jener sprachlichen Phänomene aus dem Kernbereich theoretischer 
Fragestellungen, die in Chomskys Sicht einer unbedeutenden Peripherie an- 
gehören. Dazu gehören alle holistischen Phänomene der Sprache, Mehr- 
Wort-Ausdrücke, idiomatische Ausdrücke, Valenzstrukturen, sprachliche 
Konstruktionen, wie sie auch beim kindlichen Spracherwerb zu finden sind. 
Diese Ausdrücke lassen sich in der Folge der wissenschaftlichen Diskussion 
der letzten 20 Jahre nicht mehr an die Peripherie der Sprachen und der 
Sprachwissenschaft verlegen. Auf dem Höhepunkt der jüngst geführten kriti- 
schen Auseinandersetzung zur Frage nach dem wesentlichen Merkmal der 
menschlichen Sprachbefähigung äußerten sich Pinker und Jackendoff zur 
Rolle von Idioms und Mehr-Wort-Konstruktionen: 


First, idioms and constructions are as specific to language as any other syntactic phenomenon. 
That is, they do not come for free with understanding the concepts underlying word meanings, 
and therefore cannot be relegated to FLB. 

Second, idioms and constructions are not “peripheral” to language on any ordinary understanding 
of that word. We know of no accurate estimates, but the number of idioms and constructions that 
speakers know appears to be of comparable magnitude to the number of words. Furthermore, an 
examination of any stretch of actual language shows that idioms and constructions make up a sub- 


stantial proportion of speakers’ usage. (Cognition 97, 2005: 221) 


Dieses Pladoyer zugunsten der idiomatisch geformten Sprache, also jener 
sprachlichen Phänomene, die im Alltag gehäuft auftreten und im Sprachunter- 
richt sowohl der Erst- als auch der Zweitsprache Deutsch besonders markant in 
Erscheinung treten, knüpft ein Band zwischen Sprachtheorie und Sprachlern- 
Praxis, wie es in den letzten fünfzig Jahren nicht zur Verfügung stand. Die Pra- 
xis und die Instrumente, die für die Praxis Bedeutung haben, stehen somit nicht 
mehr im Ruf, sich mit irrelevanten Epiphänomenen der Sprache abzugeben. 

Eine solche Neugewichtung hat Folgen für das theoretische Fundament der 
Sprachwissenschaft und für die Sprachdidaktik, die sich nun tatsächlich durchzu- 


setzen beginnen: 


Sollte der sprachliche Normalfall nicht das Okkasionelle, sondern das Geprägte und Vorge- 
prägte sein, müssten Theorien und Modelle der Linguistik darauf umgestellt werden, dass 
die ad-hoc-Bildungen mehr oder weniger kreative Realisierungen idiomatisch geprägter und 


vorgeprägter Modelle darstellen, dass also die grammatischen Regeln auf der Basis dieser 


Modelle funktionieren. (Ägel 2004: 67) 
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Von dieser Umwertung der Priorititen und des theoretischen Blicks auf die 
Sprachen aus können Impulse für die Sprachdidaktik abgeleitet werden, die 
ich nun schrittweise nachvollziehen möchte. Als Ausgangspunkt für die Ana- 
lyse der Schnittstelle zwischen traditioneller Grammatik und korpusorientier- 
ter Sprachbetrachtung bieten sich die Phraseologismen an, die Feilke operati- 
onal definiert: 


Idiomatische Prägung liegt vor, insofern in einer Sprache ausdrucksseitige Kombinations- und Se- 
lektionspräferenzen und die Etablierung kompositionell nicht prädiktabler, präferentieller Bedeu- 
tung von Ausdrücken zu belegen sind. (Feilke 1998: 74) 


Das Wort stellt ein Verknüpfungspotential bereit, das die strukturell möglichen 
Alternativen ermöglicht — während die Äußerung definitionsgemäß über das 
Sprachliche im engen Sinn hinausreicht und die illokutionäre Sphäre zur Be- 
stimmung von Selektivitätsmustern einbezieht (Feilke 1996: 68). Es werden 
dabei kognitive Bereiche angesprochen und aktiviert, die bei jeder Sprechtätig- 
keit eine Rolle spielen, deren Beitrag zum Glücken der Sprechakte im Rahmen 
des institutionellen Lernens aber bisher kaum zur Kenntnis genommen wurde. 
Auf dem Gebiet der Grammatiktheorie hat eine Umkehr zu Gunsten größe- 
rer Einheiten als Grundelemente der Sprache begonnen, die in der Construc- 
tion Grammar eine umfassende Definition gefunden hat. 


Any linguistic pattern is recognized as a construction as long as some aspect of its form or func- 
tion is not strictly predictable from its component parts or from other constructions recognized to 
exist. In addition, patterns are stored as constructions even if they are fully predictable as long as 


they occur with sufficient frequency. (Goldberg 2006:5) 


Sofort einsichtig sind die Konsequenzen einer solchen Sicht auf die Sprachen 
für jene Teile des Syllabus, die der Stärkung der Sprachaufmerksamkeit gewid- 
met sind, dem Aufbau und der Absicherung des Sprachgefühls und des 
Sprachgebrauchs (fluency and native-like selection). 

Aufmerksamkeit auf die Sprache, eine Sprache, die zu anderen Sprachen in en- 
gem Kontakt steht und den Einflüssen dieser Sprachen ausgesetzt ist. Das ist in 
diesem Fall das Italienische, aber die Beobachtungen und Überlegungen, die 
hier diskutiert werden, gelten analog für andere Situationen des Sprachkontakts. 
Es braucht eine Fülle von wohlüberlegten didaktischen Bemühungen, um die 
Aufmerksamkeit auf den Bereich der Mehr-Wort-Konstruktionen in beiden, 
oder in allen Schulsprachen konsequent zu fördern. Die Studierenden von 
Sprachen müssen Gelegenheit finden, Sprecher und normale Nutzer der zwei- 
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ten Sprache zu werden und sie brauchen auf dem Weg zu diesem Ziel Unter- 
stiitzung durch Unterricht und gesteuerte Ubungsstrategien. Der Gegenstand 
des Lernens und Ubens ist nicht allein die neue Sprache, sondern die Ubung 
einer Haltung zu den Sprachen und zum Spracherwerb, die in einen umfas- 
senden kognitiven Rahmen eingebettet ist. Diese Rahmenbedingungen sind 
zu schaffen und die Lernenden sind darauf vorzubereiten, Wege des Ubens 
einzuschlagen, die ihren bisherigen Lernerfahrungen in keiner Weise entspre- 
chen. Eine solche Verinderung im Lernverhalten ist cin langwieriges Unter- 
fangen und nur mit großem Aufwand zu erreichen. 

Sprache ist ein zentrales Thema für Kultur, Bildung und Schule. Ein Thema 
mit einem unermesslichen Potential an Wissensbedarf, Forschung sowie kul- 
turpolitischen Aktivitäten und Entscheidungen. Dieser Anspruch kollidiert 
mit der immer stärker sichtbaren Ressourcen-Knappheit. Aufmerksamkeit und 
Lebenszeit sind zu Zielen der Anbieter von Medieninhalten geworden. In al- 
len Bereichen stellt die Verteilung der Ressourcen ein brisantes Thema dar. 
Der Kampf um die Ressource Aufmerksamkeit betrifft nicht nur die Medien 
und den ungeübten Nutzer eines ins Unermessliche gestiegenen Überange- 
bots, sondern auch Forscher, Wissenschaftler, Lehrpersonen und Anwender 
von Theorien. Auch sie sind einem Überangebot ausgesetzt und gezwungen, 
zu wählen. Die Schritte in die Praxis und in der Praxis sind abhängig von den 
Fragen, die wir stellen, von den Büchern, die wir lesen und den Prioritäten, die 
wir auf der Grundlage des geteilten Wissens setzen. Mit klaren Worten: Wir 
können es uns nicht leisten, die Ressourcen an Zeit und an Aufmerksamkeit 
mit nicht adäquaten Lernobjekten und Lernstrategien zu vergeuden. 

Philip Lieberman hat in seinem Buch „Human Language and Our Reptilian 
Brain. The Subcortical Bases of Speech, Syntax and Thought“ (Harvard Uni- 
versity Press 2000), in dem viele der heute aktuellen Themen im Bereich der 
Sprache und der Kognitionsforschung antizipiert werden, Schlüsse gezogen, 
die auf unser Handeln im Bereich des Sprachunterrichts direkte Folgen haben: 


If language were an instinct, then only minimal attention would have to be paid to the circum- 
stances in which children are raised. In this light, spending public funds to enrich the lives of 
children born into poverty would be unnecessary. 

As the evidence discussed in this book demonstrates, language is a skill. Like other skills, such as 
playing the violin, certain neural and anatomical mechanisms are required. But like other skills, 


language is honed by practice in places and circumstances conducive to learning. (166) 


Wie heftig umkämpft solche Äußerungen im Jahr 2000 noch waren, klingt im 
Umkreis der zitierten Worte an, wo Liebermann sich von der These distan- 
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ziert, Sprache sei ein Instinkt und umfassende bildungspolitische Konsequen- 
zen aus der von ihm aufgezeigten neuen Sicht auf die Sprache und den Spra- 
cherwerb ableitet, die im lakonischen Satz münden: The message here is that we 
as a nation have not done enough. 

Ich möchte für meinen Bericht über Anwendungen von Korpusinstrumenten 
im Sprachunterricht in der mehrsprachigen Lernsituation, wie sie für Südtirol 
charakteristisch ist, nun den kleinen Abschnitt aus dem Zitat nutzen, der uns 
in medias res der Arbeit begleiten kann: But like other skills, language is honed 
by practice in places and circumstances conducive to learning. 

Der Schwerpunkt liegt bei der Frage, ob in ausreichendem Maße dafür ge- 
sorgt ist, dass die Lernumgebung, in der unsere Schüler die von ihnen erwar- 
teten Leistungen erbringen sollen, tatsächlich produktives Lernen zu fördern 
imstande ist und welche Aktivitäten des Lernens und des Übens bevorzugt 
angestrebt werden sollen — wobei ich gleich an ein Wort erinnern möchte, das 
Konrad Ehlich auf dem Neustifter Kolloquium im Januar 2008 gesprochen 
hat: Sprache kann nicht als Unterrichtsgegenstand gelehrt und gelernt werden. 

In der für Südtirol typischen Lernsituation können wir davon ausgehen, dass 
für das Erlernen der Zweitsprache überdurchschnittlich viel Zeit zur Verfü- 
gung steht. Von der Grundschule bis zum Abitur absolvieren die Schüler ins- 
gesamt nicht weniger als 2.500 Stunden Sprachunterricht. Das ist, gemessen 
am Stundenkontingent der öffentlichen Schulen in Italien, sehr viel. Gemes- 
sen am zeitlichen Aufwand, den das Kind benötigt, um die erste Sprache zu 
lernen, ist es aber immer noch unerhört wenig. Sprachenlernen im fortge- 
schrittenen Alter, also jenseits des kognitiven Fensters der ersten Jahre nach 
der Geburt, braucht besondere Unterstützung und Hilfestellungen. 

Worin diese Unterstützung bestehen soll, kann mit einem Satz umschrieben 
werden: entscheidend für effizientes Lernen ist das Ermöglichen von sehr vie- 
len sinnhaften Begegnungen und Erlebnissen mit der neuen Sprache. Mit 
dem Hinweis auf den comprehended input (Gasser, 1994) ist dabei so etwas wie 
ein unterer, minimaler Schwellenwert angesprochen. Denn zum reinen Verste- 
hen kommt noch die emotionelle Erfahrung sinnhaften Handelns und etwas, 
was man altmodisch mit Freude am Handeln und am Lernen bezeichnen kann. 
Das führt in direktem Anschluss an das neue Grammatik-Modell zu Lern- 
und Übungsstrategien, die Wege des Lernens fördern wie das Beobachten und 
Vergleichen von Erfahrungen, Analogieschlüsse, inferenzielle Schlüsse, die 
metasprachliche und metakommunikative ski//s verlangen, die sich im Lauf der 
Zeit zu brauchbaren Arbeits- und Lerninstrumenten entwickeln. Den formel- 
haften Ausdrücken der Sprache kommt dabei eine besondere Bedeutung zu. 
Sie stellen eine Brücke dar zur authentischen Sprache der Menschen, die diese 
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Sprache im Alltag sprechen, und die die Lernenden als die andere Sprach- 
gruppe vor Augen haben. Die Sprachgruppe, der sie selbst nicht angehòren. 
Die Erfahrung des Trennenden schlechthin. Erfolgreiches Erlernen der for- 
melhaften Sprache eröffnet einen Weg zur anderen Sprachgruppe, wie neuere 
Forschungen nahelegen, die eine positive Korrelation zwischen dem erfolgrei- 
chen Lernen der formulaic language und der sozialen Integration der Lernen- 


den festgestellt haben. (Adolphs/Durow 2004; siehe auch Dörnyei et al. 2004) 


1. Die Aufmerksamkeit schulen 
Vor diesem Hintergrund möchte ich einige Momente des Lernens mit Hilfe von 
Korpusinstrumenten aus unserer sprachdidaktischen Praxis an der Freien Univer- 
sität Bozen referieren. Nach mehrjähriger Erprobung der Korpusinstrumente ei- 
ner eigens für die Sprachdidaktik optimierten Plattform, hat sich folgende An- 
ordnung der Arbeits- und Übungsstrategien als vorteilhaft herausgestellt: 
Jede Unterrichtseinheit besteht aus 7 Schritten: 
1. Schritt (Lehrer) 
Wahl eines Textes (Kriterien der Wahl: Inhalt, Sprache, Textaufbau) 
Suche nach Vergleichstexten und Vorbereitung eines Dossiers zum Thema; 
2. Schritt (Klasse) 
Lektüre des Ausgangstextes in der Klasse, erste Erkundung des sprachli- 
chen Umfeldes durch spontane Suche (Snippets in Google), Brainstor- 
ming (Was weiß ich schon zum Thema), Vergleichstexte, Erarbeitung 
von Ein- oder Zwei-Satz-Zusammenfassungen mit Hilfe von Baustei- 
nen des ersten Textes; 
3. Schritt (Klasse oder zu Hause): 
Zusammenfassung und Kommentar (jeweils max. 60 Wörter); 
4. Schritt (Lehrer) 
Korrektur der Arbeiten, Anonymisierung der Schülerarbeiten; 
5. Schritt (Lehrer und Schüler) 
Besprechung einer oder mehrerer Schülerarbeiten in der Klasse, Fokus- 
sierung sprachlicher Charakteristiken und Muster (ebenso Musterab- 
weichungen), Strategien werden transparent gemacht, autonome Suche 
im Korpus wird angeregt und unterstützt (Suchanweisungen - Unter- 
streichungen - werden gegeben); 
6. Schritt (Schüler): 
Ergebnisprotokoll der Suche, Vertiefung der Suche, Serendipity-Prinzip; 
7. Schritt (Lehrer oder Schüler) 
Evaluation und/oder Peer-reviewing. 
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Ein typischer Text aus dem hier angesprochenen Umfeld des Lernens und des 
Sprachgebrauchs ist folgender Kommentar einer Südtiroler Studentin zu ei- 
nem Bericht über die „Deutschpflicht“ an der Hoover-Schule in Berlin. Der 
Ausgangstext ist ein Interview in der ZEIT. 


Die Zeit - Chancen Schule - Nr. 26 - 21. Juni 2007 

Gefragt - Nezir Asanovic, 16, Schulsprecher an der Herbert Hoover-Gesamtschule in Berlin-Wedding 
Wir sprechen Deutsch 

Seit anderthalb Jahren müssen an Ihrer Schule alle Schüler Deutsch sprechen, egal ob im Unterricht 
oder auf dem Schulhof. Hat die Deutschpflicht das Klima an der Schule verändert? 

Es ist viel friedlicher geworden an unserer Schule, die Atmosphäre hat sich gewandelt. Es gab in 
diesem ganzen Schuljahr keine einzige Schlägerei. Früher gab es etliche, die oft nur durch Miss- 
verständnisse entstanden sind. 

Durch sprachliche Missverständnisse? 

Ja. Wir haben einen Ausländeranteil von 90 Prozent an unserer Schule, hier mischen sich rund 16 
Nationalitäten. Da rufen ein paar Türken einem Araber was auf Türkisch hinterher, der es gar nicht 
oder falsch versteht, und schon fühlt er sich in seinem Stolz verletzt und muss sich verteidigen. Wir 
waren selbst überrascht, dass viele körperliche Auseinandersetzungen so viel mit Sprache zu tun hat- 
ten. Seitdem alle Deutsch miteinander sprechen, entstehen bestimmte Konflikte gar nicht erst. 
Wirklich alle? 

Natürlich gibt es immer Schüler, die provozieren wollen. Das war ganz extrem, als die Deutsch- 
pflicht eingeführt wurde. Viele Schüler fühlten sich angegriffen, fanden die Entscheidung rassis- 
tisch. Aber ihr Protest zielte bald ins Leere. Wir haben viel mit Lehrern diskutiert, und die Mehr- 
heit der Schüler war sehr schnell vom Sinn dieser Regel überzeugt. 

Was passiert mit denen, die trotzdem nicht Deutsch reden? 

Heute passiert das kaum noch. Das Deutsche gehört jetzt zum Schulalltag. Bestrafungen gab es von An- 
fang an nicht, nur Ermahnungen. Ich glaube, auch deshalb verlor das Provozieren sehr schnell seinen Reiz. 
Hatte die neue Regel auch Auswirkungen auf den Unterricht? 

Ich glaube, das Leistungsniveau in unserer Klasse ist gestiegen. Wir reden auf einem ganz anderen 
Niveau miteinander. Diskutieren plötzlich über Texte und Gedichte, alleine unter Schülern. So 
was gab's früher kaum. Da war es vielen peinlich, etwas Falsches auf Deutsch zu sagen. Heute ge- 
winnt man mit jedem Tag mehr Selbstbewusstsein. 

Sind sich die vielen Nationen nähergekommen? 

Das multikulturelle Gefühl an der Schule ist stärker geworden. Es ist jetzt egal, ob einer Türke ist 
oder Araber. Dafür steht auch, dass ich als Serbe überhaupt Schulsprecher werden konnte — trotz 
unserer großen türkischen Mehrheit. 


Schülerarbeit 
Kommentar: Wir sprechen Deutsch 
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Meiner Meinung nach gibt es in Bezug auf die Einführung der Deutsche Sprache einige positive Aspekte. 
Ich denke, dass eine einzige Sprache viele Probleme in der Schule lösen kann. 

In diesem Fall hat die Sprache verschiedene Kulturen, Nationalitäten und Einstellungen verbunden. 
Dank der Sprache fühlen sie sich Teil der selben Gruppe. 

Da die Schüler verpflichtet sind, ausschließlich Deutsch zu sprechen, nutzen sie die Deutsche 
Sprache und verbessern deren Sprachkompetenz. 

Im Allgemeinen ist diese Pflicht positiv, weil die Schule immer etwas Konkretes machen sollte, 


um die Schwierigkeiten zu überwinden. 


Die mangelnde Textualität ist, wie auch in sehr vielen anderen Fällen, schon 
am Zeilenumbruch nach jedem Satz zu erkennen. Jeder Satz steht wie eine 
Insel für sich, ohne jede Verbindung zu den anderen Sätzen oder zu einem wie 
immer gearteten Textzusammenhang. Die Isolation der Einzelsätze verführt 
dazu, die Sätze tatsächlich in ihrer Isolation wahrzunehmen und nach rein 
formalen Gesichtspunkten zu bewerten. 

Im Rahmen unseres Lernmodells mit Korpusinstrumenten sind zwei Kompo- 
nenten klar zu unterscheiden. Erstens die Schulung der Sprachaufmerksam- 
keit, die von Fall zu Fall in allen drei Schulsprachen erfolgt, und zweitens der 
Aufbau der für die Resonanz nötigen kognitiv-sprachlichen Infrastruktur, wo 
die Lexik in Form von verknüpften Konstruktionen und chunks im weitesten 
Sinn ihren Ort finden kann (Drumbl, in diesem Band). Für die Studierenden 
nach 13 Jahren Schulunterricht geht es darum, den Ort für die fehlende 
Grundlage einzurichten und auszustatten. Lernende in der ersten Phase des 
Lernens können hingegen von Anfang an damit beginnen. Das ist der Grund 
dafür, weshalb wir den Einsatz von Korpusinstrumenten im Anfängerunter- 
richt nicht ausschließen. 

Hier wird die Übung mit Studierenden wiedergegeben, die 13 Jahre Schulun- 
terricht hinter sich haben und in einem zweisprachigen Studiengang in Südtirol 
studieren. Die Übung hat das Ziel, die Schärfung der Sprachaufmerksamkeit 
mit dem Aufbau der fehlenden oder extrem fragilen sprachlichen Grundlage zu 
verbinden. Als Anlass könnte das fehlende n der Adjektivendung erscheinen, 
das allerdings nicht einfach als Korrektur in die Arbeit eingetragen wird, son- 
dern zum Auslöser einer gezielten Korpusrecherche wird: 

[...] die Einführung der Deutsche Sprache [...] 

Die Übung ist Anlass, zwischen den beiden Eingabefenstern unterscheiden zu 
lernen, dem Fenster für die Eingabe eines Lemmas und dem Fenster für die 
Eingabe von Wortverbindungen oder von einzelnen Wortformen. Beim Su- 
chen ist es von grundlegender Bedeutung, das, was der Suchende mit großer 
Sicherheit weiß und kann, von dem zu trennen, wo noch Unsicherheit 
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herrscht. Voraussetzung ist daher die Kenntnis der Lemma-Form der gesuch- 
ten Worter. Im Zweifel kann die Form probeweise als Lemma eingegeben und 
auf diese Weise tiberpriift werden. In der ersten Phase der Arbeit mit Korpus- 
belegen ist die Suche mit Lemmata der Suche nach festen Mehr-Wort-Grup- 
pen (Purase-Fenster) vorzuziehen. 


Abb. 1: dewac - Korpus Südtirol 


Die erste Gruppe wird daher in die beiden Nominal-Lemmata aufgelöst und 
als Einführung + Sprache rechts Abstand 3 eingegeben. 


Regimes , Emstellung der Russfiserung ‚Einführung der polmischen Sprache in den Schulen , 
ermittelt wad . Unterrichtete Fächer : - Einführung Hilfe Hausaufgaben Sprache Hausaufgabentulfe 
3.08-002834-8 Inhalt JURGEN TRABANT Zur Einführung : Fremde Sprachen in Babel und Paris L 
Versammiungen auferlegt werden . Unbeschadet der Einführung einer offiziellen Sprache durch die cechoskovakische 
Selbstverwaltung * , " kulturelle Freiheit * und * die Einführung der kurdischen Sprache neben dem Persischen 
Book genannt . Eine leicht verstandiche Einführung in die Sprache Perl . Jedes Kapitel wird 
Kommunikation ergeben habe , nämlich mit der Einführung der Sprache und später der Schrift , plädiert 


untergliedert . Der umfangreichere Teil 1 wird als Einführung in die Sprache zusammengefasst und ist 
folgenden Kaptein finden Sie eine komplette Einführung im die Sprache „stets anhand von prausnahen 
samt Register und einer landeskundbch* Einführung in $ Sprachen . Dieses Produkt ist dank 

an denen man in Siam kemen konnte . Die Einführung der englischen Sprache als Unterrichtsfach 
Sitten und Bräuche des Ortes zeigt . Eine Einführung in die Sprache gibt es hier . Informationen 
überhaupt nicht mehr verständigen . Die Einführung der russischen Sprache als Unterrichtssprache 
darauffolgenden Jahren kam es zu Konflikten um die Einführung der russischen Sprache als Unterrichtssprache 


Widerstand * leisteten viele Kolonisten bei der Einführung der russischen Sprache als Amtssprache 


Abb. 2: dewac - Korpus Südtirol 
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Bei den Ergebnissen wird die korrekte Adjektivendung im Genitiv angezeigt, de- 
ren Korrektur aber nicht das Ziel der Aufgabe darstellt. In der Einführungsphase 
kann also unauffallig auf diese hochfrequente Fehlerquelle hingewiesen werden. 
Sogleich kann der Abstands-Parameter transparent gemacht werden. Bei 4b- 
stand 1 werden keine Worter zwischen den beiden Nomina angezeigt, also auch 
keine Adjektive, die für die Lernenden von Interesse sind. Also muss der Ab- 
stand vergrößert werden, wie bei dieser Suche, die mit Abstand 3 durchgeführt 
wurde, wobei zwei deutlich unterschiedliche Muster erkennbar werden: Einfüh- 
rung der und Einführung in die [...]. 

Die computertechnische Einführung in die Bedienung der Software stellt also 
schon einen unauffälligen Moment des Erlernens der Sprache dar. 

Nach dieser Einführung ist es nicht mehr notwendig, die Abweichungen inner- 
halb der Nominalgruppen immer wieder als eigene Suche vorzuschlagen. Wir 
formalisieren solche Vorschläge zum eigenständigen Suchen, indem wir in den 
Schülerarbeiten vier Stellen unterstreichen, zwei korrekte und zwei fehlerhafte. 
Die Lernenden müssen selbst herausfinden, welche Stellen korrekt formuliert 
sind. Die Überprüfung dient dabei nicht eigentlich der Fehlerkorrektur, sondern 
der Suche nach rekurrenten Mustern und dem Vergleich der gefundenen Muster 
mit dem selbst geschriebenen Satz oder der Wortgruppe. 

Solche Recherchen werden nach einigem Üben selbstständig gemacht. Vor al- 
lem bei der Arbeit in Kleingruppen funktioniert das selbst-gesteuerte Suchen, 
jeder Fund motiviert zu weiteren Suchaktionen, die sodann in rudimentärer 
Form dokumentiert werden. Durch Unterstreichen von vier Mehr-Wort- 
Gruppen pro Schülertext werden Suchaufgaben aufgegeben, die individuell 
oder in Kleingruppen gelöst werden können. Es werden auch sprachlich un- 
auffällige Gruppen markiert, so dass die Recherche nicht den Status einer 
Fehlerkorrektur erhält, sondern den einer Suche nach dem Potential von Kon- 
struktionen mit ihren Variationen und ihren unterschiedlichen Kontexten. Die 
Studenten müssen entscheiden, ob sie durch Eingabe in das PHRasE-Fenster 
nach festen Verbindungen suchen wollen, oder nach zwei oder drei Wörtern 
mit Angabe der Position und des Abstandsparameters. Hier zwei Angaben im 
ersten Satz des Schülertextes, die unterschiedliche Suchstrategien verlangen. 
Die erste Gruppe, als Einführung + Sprache rechts Abstand 3 eingegeben, ergibt 
ein differenziertes Ergebnis mit relevanten Beispielen für Amzssprache und für 
Unterrichtssprache. Ganz nebenbei wird die Adjektivendung angezeigt, deren 
Korrektur aber nicht das Ziel der Aufgabe darstellt. 

In bestimmten Fällen könnte diese Gruppe auch ohne Markierung bleiben, 
um den Eindruck zu vermeiden, das Aufsuchen von Fehlern sei das Ziel der 
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Arbeit. Die erste Recherche ist somit der auf den ersten Blick erkennbaren 
Gruppe einige positive Aspekte gewidmet, 

Meiner Meinung nach gibt es in Bezug auf die Einfihrung der Deutsche 
Sprache einige positive Aspekte. 

die als Konstruktion in das PHRASE-Fenster eingetippt werden kann, falls die 
Studierenden die Gruppe mit grofer Sicherheit als korrekt erkennen. 


Abb. 3: dewac — Korpus Südtirol 


Die Suche endet mit einer Überraschung. Mit Hilfe der Korpussuche können 
nämlich Gebrauchsbeschränkungen erkannt werden, die selbst versierten Spre- 
chern des Deutschen nicht immer bewusst sind. Der chunk einige positive As- 
pekte wird in allen Belegen aus dem Korpus von einem obligatorischen negati- 
ven Hintergrund abgehoben. Der negative Hintergrund gehört demnach zum 
Glücken des Sprechaktes, in dem diese Wortverbindung vorkommt. 
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Concordance| Word Sketch] Thesaus| Sketch Der} Frequency] Collocation] 
View onions] Sample] Fiver] [Son] [88] 35158] 


wahrschemich ab . Es hat aber , so meine ich , auch einige positive Aspekte zu vermelden , de Grafik ist besser , 
besetzt werden , von daher gibt es auch einige positive Aspekte fix den Arbeitsmarkt . 17 ) Sollten mar 
getesteten ' 3-out rule ' gewinnt von Reth einige positive Aspekte ab . So wurde das Spiel in der Tax offensiver 
Letztlich kann ich diesem besonderen Geburtstag einige positive Aspekte abgewinnen : Ich weiß mun sicher , dass 
in finanzieller Hinsicht . Es git aber einige positive Aspekte zu bedenken : Im MVZ bieten sich gerade 
absoluten Tophits wurden . Zum Schluss noch einige positive Aspekte; Die Gehaktszahdung ( neuerdings zweimal 
deutschen Code2-Markt . Der Fim bietet einige positive Aspekte, kann aber insgesamt nicht über das durchschesttiiche 
den Sarkasmus bei Seite , kann man dennoch einige positive Aspekte des Leutzscher Spiels hervorheben So 
ist bis heute nicht der Fall, Wir schen einige positive Aspekte , de unserem drei-Punkte- Plan zur Ganztagsbetrewung 
(GRÜNE ) : Das vorbegende Konzept hat einige positive Aspekte: die Linien reichen über Mödling hinaus 
berichtet werden . Wollen wir also zunächst einige positive Aspekte, die am Beginn der Versammiung lagen , 
Bequemschuh . Es gibt aber einige Produkte , die einige positive Aspekte vereinigen . Und wem die bei der Anprobe 
Anemanderrcihung von Katastrophen darstellen . Es gbt einige positive Aspekte. An erster Stelle steht tierbei das Hausapotbekenmodelli 
sagte Krunic . Trotz aller Probleme sieht er einige positive Aspekte: * Die enorme Leistungsbereitschaft aller 
Empire zu retten | Es gibt darin sicher einige positive Aspekte , so vor allem , dass man nicht ales dem 
" Dieses Ausgabenprogramm , das durchaus einige positive A. te aufweist , ist durch seme emseitige Ausrichtung 
Irak geäußert . Der Entwurf enthalte zwar einige positive Aspekte, sagte der stellvertretende Außenminister 
ich glaube . daß ich an anderen Stellen einige positive Aspekte meiner Haltung unterbewerte | Der Zweck 
Missionierungsstrategen thematisiert ! Auf einige positive Aspekte der christich-juedischen Zusammenarbeit 
fo Auswirkungen der vorgeschiagenen Änderungen , die einige positive Aspekte enthielten , aber auch deutliche Verschärfungen 


Abb. 4: dewac — Korpus Südtirol 


Ist einmal die Sensibilität für diese Art von Gebrauchsbeschränkungen von 
Konstruktionen geweckt, werden auch andere Ausdrücke des Textes fragwür- 
dig: eine einzige Sprache, (hat) Einstellungen verbunden, Dank der Sprache, nut- 
zen sie die Sprache u.a. m. 

Die Überprüfung dieser fragwürdigen Fälle wird von den Studierenden bereits 
selbstständig durchgeführt (vorteilhaft ist die Arbeit in Paaren oder in Klein- 
gruppen). Als Ergebnis zeigt sich ein durchgehender Mangel an Idiomatizität, 
der in dieser Konstanz zu weiteren Fragen und Hypothesen Anlass gibt. So 
zur Hypothese, die mangelnde Idiomatizität stehe in kausaler Verbindung zur 
Isolation der Sätze als Einzelsätze ohne Textzusammenhang. 

Der erfahrenen Lehrperson wird sich darüber hinaus auch die Frage nach der 
Entstehung der deutschen Sätze stellen, die, den Erfahrungen nach, nicht als 
selbstständige deutsche Sätze, sondern als Übersetzungen aus dem Italieni- 
schen entstanden sind. Die Lernenden geben auch freimütig zu, dass fast al- 
les, was sie schreiben, aus dem Italienischen übersetzt wurde, so auch die ge- 
rade analysierte Nominalgruppe, die dem italienischen Ausdruck alcuni 
aspetti positivi entspricht. 

Nachdem die Suche nach dem deutschen Ausdruck die fiir alle Teilnehmer un- 
erwartete Gebrauchsbeschrinkung nachgewiesen hat, wird auch der italieni- 
sche Ausdruck fragwürdig. Und mit demselben Suchinstrument wird das itali- 
enische Internetkorpus aktiviert und die Suche nach der festen Wortverbindung 
durchgeführt, die das folgende — nicht mehr überraschende — Ergebnis zeigt: 


113 


114 


Renata Zanin 


Abb. 5: itwac — Korpus Südtirol 


info tendenza sia a favore dell'uso scolastico per alcuni aspetti positivi: con Internet si apprende molto facilmente 

nostri clienti . Tuttavia , Hotel Giant ha alcuni aspetti positivi che si riscontrano nella perfezione con 

gh aspetti negativi , ma si sottovalutano alcuni aspetti positiviche , senza chidere i problemi real esistenti 

dopo le elezioni , progetto che pur conalcuni aspetti positivi, presenta molte zone d ombra Progetto 

info oguna di loro scopriremmo che , accanto adalcuni aspetti positivi, si ritrovano tutte le contraddizioni 

info essi interagiscono SBN ha finora riflesso alcuni aspetti positivi ed altre marcate negatività Ne parlerò 

info amministrativo europeo . ll Mediatore riconosce alcuni aspetti positivi del processo di riforma in atto . Ad esempio 
affermare con certezza che , nonostante alcuni aspetti positivi, riguardanti la formazione artistica storica 

rispondere . Di certo la muova legge introduce alcuni aspetti positivi. La questione dei combattimenti tra cani 
missioni vari esperti che sottolinearono alcuni aspetti positivi della politica di austerità applicata da 


info nostalgica del buon-tempo-andato senza negnre alcuni aspetti positivi del mondo rurale . e nello stesso tempo 
divenuto straniero e rinunciare anche ad alcuni aspetti positivi della Svizzera , come i sistema sanitario 
studiosi e operatori ) . E' vero che vi sono alcuni aspetti positivi, fra i quali vanno ricordati : J fatto 
dalla Lega - nella quale sono contenuti alcuni aspetti positivi, sia una serie di emendamenti presentati 
studiosi e operatori ) . E' vero che vi sono alcuni aspetti positivi, fra i quali vanno ricordati : J fatto 
sfondare " . La riforma ( pur presentando alcuni aspetti positivi) rischia di provocare una serie di problemi 
nel contesto generale sono da evidenziare alcuni aspetti positivi del governo regionale , come : - T attivismo 


Abb. 6: itwac - Korpus Südtirol 


info 
info 
info 
info 
info 
info 


Im Italienischen gilt also genau dieselbe Gebrauchsbeschrinkung wie im 
Deutschen. Die Studenten haben den italienischen Ausdruck schon in der ita- 
lienischen Ubersetzungsvorlage falsch verwendet. 
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Wir haben ein Mosaiksteinchen ftir das Gesamtbild des Lernprozesses, 
der seinen Ausgangspunkt in italienischen Sätzen hat, die eigens dafür ge- 
schaffen werden, um als Vorlage für die Übersetzung ins Deutsche zu die- 
nen. Die fehlende Textualität, die wir im deutschen Text diagnostiziert ha- 
ben, stammt in vielen Fällen schon aus der italienischen Vorlage und 
entsteht durch die Isolation der italienischen Sätze als Einzelsätze, die nur 
als Übersetzungshilfe entstanden sind und nicht in der Absicht, einen ko- 
härenten italienischen Text zum behandelten Thema zu verfassen. 

Im konkreten Fall wurde der Grammatikfehler im ersten Satz nicht markiert. 
Die Korrektur des Fehlers hätte — so können wir pointiert sagen — vom Wesent- 
lichen abgelenkt, hätte das Wesentliche noch unsichtbarer gemacht, als es ohne- 
dies schon war. 

Diese Suchstrategien könnten auch mit Studenten deutscher Muttersprache 
zur Stärkung der Sprachaufmerksamkeit in der Muttersprache und der Idio- 
matizität in der Zweitsprache und im Englischen eingesetzt werden. Auch im 
Englischen gelten dieselben Beschränkungen. 

Viele Lernende reagieren auf Erfahrungen, wie die gerade beschriebene, sehr 
positiv. Sie erleben die Erkenntnis, dass die Fehlerquelle gleichsam unsichtbar in 
der Muttersprache steckt, als Aha-Erlebnis, das ihre Haltung zum eigenen 
Sprachgebrauch schlagartig ändert. Die Bereitschaft zu einer nachhaltigen Än- 
derung im Lernverhalten entsteht. Die an mehreren Sprachen - vor allem auch 
an der Muttersprache — geschulte Sprachaufmerksamkeit ist ein Mittel, um auf 
dem neuen Weg erfolgreich weiter zu gehen. 


2. Die Schnittstelle Input-Sprachverarbeitung 

Im Abschnitt über Lernervarietäten schlägt Wolfgang Klein eine Brücke zwi- 
schen der empirischen Spracherwerbsforschung europäischer Tradition und 
den input-orientierten methodischen Ansätzen, die sich in den Vereinigten 
Staaten durchgesetzt haben. (Krashen 1988; VanPatten 2002) 


Allen bisher diskutierten Theorien ist eigen, dass sie den Erwerbsprozess vorrangig unter dem 
Gesichtspunkt des verpassten Ziels betrachten: es gibt einen Standard, den der Lerner erreicht 
haben sollte - nämlich die Zielsprache -, und man bemisst den Erwerb daran, wo und warum er 
dieses Ziel (noch) verfehlt. Unter normativen Aspekten ist dies eine höchst verständliche Betrach- 
tungsweise, und ein Lehrer ist gut beraten, sie einzunehmen. Sie hat auch den nicht zu unter- 
schätzenden Vorzug der methodischen Einfachheit: man ermittelt einfach die “Fehler” des Ler- 
ners, d.h. seine Abweichungen vom Ziel, und versucht, ihr Zustandekommen zu erklären. Dies 


erklärt den erstaunlichen Erfolg der “Fehleranalyse” (Corder 1981) bei der Erforschung des ge- 
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steuerten Zweitspracherwerbs. Es ist aber wenig wahrscheinlich, dass man auf diese Weise ver- 
steht, was im Erwerbsprozess eigentlich ablauft: dies wird davon bestimmt, wie der Lerner gewis- 
se Fertigkeiten aus bestimmten Griinden auf einen bestimmten Input anwendet. Wenn man die 
immanente Gesetzlichkeit dieses Prozesses verstehen will, muss man den Lerner selbst in den 


Mittelpunkt rücken. (Klein 2001: 615) 


Beim Lernen, und vor allem aus der Perspektive gesteuerter Lernprozesse, 
geht es darum, Klarheit zu gewinnen über die Fertigkeiten, die Lernende in 
bestimmten Momenten auf den Input anwenden, mit dem sie gerade in Kon- 
takt gekommen sind. Der zuvor analysierte Text eines fortgeschrittenen Stu- 
dierenden zeigt sehr schön, wie nicht saliente Elemente der Sprache selbst 
nach Jahren der Übung im Sprachgebrauch nicht korrekt gebraucht werden. 
So verschwindet das —n der Adjektivendung in der Nominalgruppe „Die Ein- 
führung der deutsche_ Sprache“ sowohl in der gesprochenen wie auch in der 
geschriebenen Sprache mit großer Konstanz. Der „Fehler“ ist, wie alle Lehr- 
personen wissen, nur schwer korrigierbar. Die Antwort der Lernenden, „Na- 
türlich, das N“ führt nicht zu einem Kompetenzschub und zu einer nachhalti- 
gen Befähigung, die Morphologie der Nominalgruppe aktiv anzuwenden. 

Im jeweils aktualisierten Sprechakt kommen Äußerungen vor, in denen Nomi- 
nalgruppen als bedeutende Elemente im Informationsfluss eine Rolle spielen. 
Die Nomina stellen Fixpunkte für die Intention und die kommunikative Lösung 
der intendierten Äußerung dar und werden mit entsprechend großer Aufmerk- 
samkeit wahrgenommen. Der Anteil der Morphologie ist gegenüber der salien- 
ten semantischen Information immer im Hintergrund und wird immer aufs 
Neue „vergessen“. Ein Nicht-Achten, das im Moment des Sprechens und Schrei- 
bens automatisch durch die Bevorzugung der Inhaltselemente ausgelöst wird. 
Auch jahrelange Vertrautheit mit der Sprache führt nicht notwendigerweise zu 
einer Verbesserung der Kompetenz. Die Grammatikmorpheme sind nicht-sali- 
ent und bleiben bei der kognitiven Verarbeitung unberücksichtigt. Die wachsen- 
de Vertrautheit mit der Sprache, das Anwachsen des Wortschatzes gehen nicht 
Hand in Hand mit einer Stärkung der grammatikalischen Kompetenz der nicht 
salienten, im Deutschen auch durch Deakzentuierung unauffällig erscheinenden 
Grammatikmorpheme. 

Die besondere Beachtung der Verarbeitung der sprachlichen Stimuli im Mo- 
ment des Lernens ist in ein theoretisches Gerüst von Modellen kognitiver 
Sprachverarbeitung eingebettet. Die Forschung war in den letzten Jahrzehn- 
ten stark geprägt von einer grundlegend neuen Ausrichtung auf kognitive Pro- 
blemstellungen und Zielsetzungen. Zwei große Lager haben sich gebildet, die 
bis heute noch kaum Tendenzen zu einem Wissensaustausch zeigen. Grundle- 
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gend getrennt sind die beiden Forschungsrichtungen von der Definition der 
kognitiven Grundlegung des Lernens von Sprachen. Auf der einen Seite die 
Annahme einer als konstant und unveränderlich gedachten kognitiven Grund- 
lage in Form der Universalgrammatik, die stärker noch als der LAD diese For- 
schungsrichtung nachhaltig geprägt hat, und auf der anderen Seite eine Sicht 
der Kognition als emergente, nicht sprachspezifische Infrastruktur des Men- 
schen, die nach allgemeinen Prinzipien der Verarbeitung funktioniert. 

In beiden Positionen sind die Begriffe Sprachverarbeitung (Processing) zentral, 
sowie der strategische Ausgangspunkt beim Input, der die Grundlage allen im- 
pliziten und expliziten Lernens darstellt. In beiden „Schulen“ wurde, unabhän- 
gig von einander, die Erkenntnis gewonnen, dass erwachsene Lernende gegen- 
über dem Spracherwerb bei Kindern eine Charakteristik aufweisen, die 
weitreichende Folgen für den Erwerbs-, bzw. Lernprozess hat: Erwachsene er- 
reichen die Form-Funktion-Verbindung nicht mehr spontan wie es beim früh- 
kindlichen Spracherwerb der Fall ist. 

Bill VanPatten hat, ausgehend von dieser Erkenntnis, eine erfolgreiche For- 
schungsrichtung im Bereich der SLA als „Processing Instruction“ begründet. 
Er geht über die Input-These von Krashen hinaus, da Lernende, wenn sie 
nicht in einer vorbereitenden Phase ihren Input für das nachfolgende Lernen 
optimieren, in gesteuerten Lernsituationen das Lernziel nicht erreichen, das 
sie im Kontakt mit verständlichem Input (auch ohne Anleitungen durch re- 
gelbasiertes Verhalten) erreichen sollten. Der Begriff des Lernens ist dabei 
verpönt und wird seit Krashen, nicht ohne eine gewisse ideologische Verhär- 
tung, systematisch durch den Begriff des Spracherwerbs (acquisition) ersetzt. 
Lernen in Freiheit von Constraints, durch freie Verarbeitung der sprachlichen 
Stimuli steht in Opposition zur Vorstellung, die Krashen und VanPatten leitet, 
die Vorstellung eines Erwerbens der Sprache auf Grund der angeborenen kog- 
nitiven Voraussetzungen und des Setzens von Parametern bezüglich der je- 
weils aktuellen Einzelsprache. 


Van Patten verweist darauf, dass die Lernenden dazu befähigt werden müssen, 

den fremdsprachlichen Text so zu be- und verarbeiten, dass sie die dem Text 

zugrunde liegenden Grammatikstrukturen erkennen und verstehen. Er nennt 

diese Art des Lehrens processing instruction (PI). 

Processing instruction sieht vor, dass: 

1) dem Lerner die Grammatikregel erklärt wird; 

2) der Lerner auf die Schwierigkeiten aufmerksam gemacht wird, die ihm 
die Grammatikregel bereiten könnte, insbesondere im Falle von Unter- 
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schieden zwischen der Grammatikregel in der Zielsprache und der in 
der Muttersprache 


3) der Lerner Ubungen macht, bei denen er die Regel erkennen muss, um 
den Inhalt zu entschliisseln. 
Wie alle radikal innovativen Methoden, zeigt auch die PI eine starke Abhan- 
gigkeit von den Entstehungsbedingungen der Theorie, in diesem Fall von der 
Ausrichtung auf Spanisch als Fremd- oder Zweitsprache ftir englischsprachige 
Lernende. Die Position der Elemente in der linearen Abfolge der Sprachzei- 
chen hervorzuheben ist namlich gerade in solchen Fallen plausibel (bzw. folgen- 
los), wo Sprecher einer akzentzählenden Sprache mit einer stark durch die sil- 
benzählende Struktur charakterisierten Sprache in Kontakt treten, so bei 
Spanisch für englischsprechende Lerner, aber nicht umgekehrt. 
Bei Sprachen wie Deutsch, bei denen die lineare Struktur der Abfolge durch 
eine prosodisch gestaltete Informationsstruktur überlagert wird, ist die Salienz 
der einzelnen Satzglieder von der Akzentuierung bestimmt und nicht von der 
Position in der Äußerung. 
Diese „Ausnahmen“ werden dem auf der Grundlage des Englischen erstellten 
Konzepts bei VanPatten in einer späteren Phase „hinzugefügt“. Andere Ele- 
mente der Strukturierung, die kongruent zur Ausformung von Akzentgruppen 
am Aufbau der Sprache beteiligt sind, bleiben hingegen unbeachtet. 
So weit die allgemeine Charakterisierung dieses neuen methodischen Ansat- 
zes, um ihm gegenüber den Ansatz des korpusgestützten Lernens abzusetzen. 
Einen grundsätzlich anderen Weg geht die wissenschaftliche Schule, die Spra- 
che als emergentes System ansieht und die ich hier an Hand der Arbeiten von 
Nick Ellis referieren möchte, da Ellis im Dialog zur Schule VanPattens aufge- 
treten ist. 
Die unterschiedlichen Ansàtze treffen sich in der theoretisch begrindeten 
Grundsatzentscheidung, den Erwerbsprozess, das Erlernen der Sprache, als 
„ungesteuerten“ Prozess anzusehen, der nur ausgelöst und gelenkt, nicht aber 
wirklich methodisch „beherrscht“ werden kann. Nick Ellis, der ein umfassen- 
des Konzept vorgelegt hat, erfasst schr genau den kritischen Moment der 
Theoriebildung, die am Begriff des Input ansetzt: 


Associative learning provides the rational mechanisms for first language acquisition from input- 
analysis and usage, allowing just about every human being to acquire fluency in their native 
tongue. Yet although second language learners too are surrounded by language, not all of it ‘goes 
in’, and SLA is typically much less successful than L1A. 

This is Corder’s distinction between input, the available target language, and intake, that subset of 


input that actually gets in and which the learner utilizes in some way (Corder 1967). Does this mean 
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that SLA cannot be understood according to the general principles of associative learning that un- 
derpin other aspects of human cognition? If L1A is rational, is L2A fundamentally irrational? 
Children learning their native language only acquire the meanings of temporal adverbs quite 
late in development. But second language learners already know about adverbs from their first 
language experience, and adverbs are both salient and reliable in their communicative func- 
tions, while tense markers are neither. Thus, the second language expression of temporal refe- 
rence begins with a phase where reference is established by adverbials alone (Bardovi-Harlig 
1992; Meisel 1987), and the grammatical expression of tense and aspect thereafter emerges only 
slowly, if at all. (Bardovi-Harlig, 2000) 


Ungesteuertes Lernen bedarf der Aufmerksamkeit als allgemeiner Haltung 
gegentiber den im Kontakt mit der neuen Sprache empfangenen Vorlagen und 
hat im Falle des Zweitspracherwerbs mit echten Lernbehinderungen zu rech- 
nen, die darin bestehen, dass die in der Erstsprache erworbenen metasprachli- 
chen Kenntnisse gerade grammatikalisch saliente Elemente der neuen Sprache 
als redundante Angaben ausweisen, die der Aufmerksamkeit der Lernenden 
entzogen werden. 

Das kommunikativ und inhaltsbezogene Lernen — auch in Fach-Sprach-Un- 
terrichtsmodellen — muss in dieser Perspektive durch Ubungen ergänzt wer- 
den, die gerade die nicht salienten Merkmale der Sprache unauffällig aber effi- 
zient in den Vordergrund rücken. Das Hauptaugenmerk liegt nicht so sehr auf 
der Form der Darstellung, also der Qualitat, als vielmehr auf der Quantitat der 
dargestellten Formen. 

Das Erlernen einer neuen Sprache in der Schule braucht nicht so sehr neue 
methodische Inspiration als vielmehr einen quantitativen Schub, der von den 
punktuellen Momenten des Sprachkontakts zu einer Begegnung mit der neu- 
en Sprache führt, die dem sogenannten „Sprachbad“ der natürlichen Spracher- 
werbssituation vergleichbar ist. Ein Mehr an verständlichem Input, das zu er- 
reichen allerdings jenseits der Unterrichtsstunden liegt (Drumbl 2008a). Der 
Unterricht hat sich diesen quantitativen Anforderungen zu stellen, und sich 
ihnen gegebenenfalls auch unterzuordnen. Genau an dieser Stelle, wo Anfor- 
derungen der Qualität und Quantität zusammentreffen, haben gesteuerte 
Übungen auf der Grundlage von Korpusrecherchen ihren Platz. 

Im Sprachsyllabus für Anfänger ist in unseren Kursen die Lektüre des Ro- 
mans „Selbs Justiz“ von Bernhard Schlink und Harald Popp vorgeschrieben 
(in Ausnahmefällen begnügen wir uns mit dem ersten Teil, mit seiner abge- 
schlossenen Handlung). Der Roman ist als Korpus aufbereitet und kann mit 
der auch bei den anderen Quellen benutzten Suchsoftware durchsucht wer- 
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den. Die Beschränkung auf einen kurzen Text lässt folgende untypische Cha- 

rakteristiken der Korpusarbeit hervortreten. 

1. Alle Belege sind brauchbar. 

2. Alle Belege werden vom Lernenden beim Lesen des Buches wiedergefunden. 

3. Alle Belege gehören zur Basisgrammatik, die die Studierenden auf jeden 
Fall lernen „wollen“. 

Sind diese Voraussetzungen gegeben, kann schon die als Wordform eingegebe- 

ne Suche nach dem Artikel „den“ von großem didaktischen Nutzen sein. Die 

Belege betreffen sowohl den Akkusativ Singular als auch den Dativ Plural. Je- 

der Beleg weist redundante Merkmale auf, um den Singular vom Plural zu un- 

terscheiden, und die Anwesenheit oder Abwesenheit von Präpositionen gibt 

einen klaren Hinweis auf den Kasus. 


Home| Concordance| Word Sketch| Thesaurus] Sketch-Diff | Frequency] Collocation| 
KWIC/Sentence| View options] Sample| Filter| ‚Sort| 2] ==] = 


Pagel Jot47(SO]] score ast 


selbs justiz ihn . Er zeigte mir auch , wie man's mit den Madchen macht . Ich lief neben der Kleinen 
selbs justiz heirateten , war er Trauzeuge und schenkte mir den Schreibtisch , der heute noch in meinem 

selbs justiz machte meinen Assessor . Als 1942 Korten beiden Rheinischen Chemiewerken in Ludwigshafen 
selbs justiz Staatsanwaltschaft Schluß . und er verhalf mir zuden ersten Aufträgen im Wirtschaftsmilieu . 

selbs justiz Freunde . Dann ich erinnere mich gut anden Morgen . Mir lag die Welt zu Füßen . Mein 
selbs justiz aus fand ich jedenfalls . Der Wind trieb den vertrauten Chemiegestank nicht hierher 

selbs justiz anderen Nachricht bat Frau Schlemihl von den Rheinischen Chemiewerken um Rückruf . " 
selbs justiz Mannheim und Ludwigshafen leben wir unter den Augen der Rheinischen Chemiewerke . Im 
selbs justiz Anilin- und Soda-Fabrik , wurden sie von den Chemikern Professor Demel und Kommerzienrat 
selbs justiz eigenen Bereich mit mehreren Salons . die inden Farben gehalten sind . mit deren Synthese 
selbs justiz leider etwas verspäten würde . Ich bestellte den zweiten Aviateur . "Campari . Grapefnuitsaft 
selbs justiz . Und du gibst das Ruder noch nicht aus den Händen ? "" Ich würde gerne . Aber ein 

selbs justiz Krawatte . Er nahm meinen Arm ." Laß uns inden Blauen Salon gehen , es ist angerichtet 

selbs justizangerichtet haben können , und es geht nur darum ‚den Richtigen rauszufinden . Eben das sollst 

selbs justiz leidige Angelegenheit sprechen - wir haben inden Jahren seit Klaras Tod so selten Gelegenheit 
selbs justiz hätte aufmerken sollen . als Korten vonden Opfern sprach . die wir haben bringen und 
selbs justiz erzählen können und ließ es bleiben . Ich trank den Mokka aus . und Korten hob die Tafel auf 
selbs justiz verabschiedete uns . Wir machten uns aufden Weg ins Werk . Es waren nur ein paar Schritte 
selbs justiz dann war er weg . Frau Schlemihl . seit den fünfziger Jahren Kortens Sekretärin , hat 

selbs justiz benutzte Brille am goldenen Kettchen um den Hals und war beschäftigt . Ich stand am 


Abb. 7: http://search.korpus-suedtirol.it:809 1 / 


Die Aufgabe lautet einfach, die Belege nach Mustern zu sortieren. Das ge- 
schieht im gesteuerten Unterricht in Zweiergruppen. Je zwei Lernende arbei- 
ten an einem PC und ordnen die Belege in einem gemeinsamen Sprechakt 
durch halblautes Vorlesen der KWIC-Stellen und Kommentieren („Typus 
eins“). 

Die Belege werden in der Reihenfolge der ersten Seite gegeben: 
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Er zeigte mir auch, wie man's mit 


den 


Madchen macht. Ich lief neben 


der Kleinen 


heirateten, war er Trauzeuge und 
schenkte mir 


den 


Schreibtisch, der heute noch in 
meinem 


Die unvorhersehbaren Bruchteile von Sätzen in den einzelnen Zeilen provo- 
zieren gleichsam inferenziell forschendes Weiterdenken und „Weiterlesen“ 


über die Bruchstellen hinweg. Da der erweiterte Kontext durch einen Klick 


ohne Verzögerung aufgerufen werden kann, nehmen Studierende diese Opti- 
on in ausgewählten Fällen spontan wahr. Die unvollständigen Sätze mit ihren 
salienten Mustern können daher schon bei mäßig fortgeschrittenen Lernen- 
den zur Schulung der Inferenz genutzt werden, mit selbstgesteuerter Überprü- 
fung der Ergebnisse des inferentiellen Erprobens. Aber auch ohne Verständnis 
des Kontextes wird bei diesem Beleg die Grammatik der Erstfeld-Besetzung 


transparent. 
3 | machte meinen Assessor. Als 1942 | den | Rheinischen Chemiewerken 
Korten bei anfıng 
4 und er verhalf mir zu | den | ersten Aufträgen im Wirtschafts- 
milieu 
5 Freunde. Dann ich erinnere mich | den | Morgen. Mir lag die Welt zu 


gut an 


Füßen. Mein 


Beleg 5 mit einem OCR-Fehler, „Dann“ an Stelle von „Denn“, der vom Kor- 
rekturprogramm nicht erfasst wurde. 


aus fand ich jedenfalls. Der Wind 


vertrauten Chemiegestank nicht 


Salons, die in 


6 trieb den hierher 
7 anderen Nachricht bat Frau d Rheinischen Chemiewerken um 
Schlemihl von en | Rückruf 

Mannheim und Ludwigshafen Augen der Rheinischen Chemie- 

8 - den 
leben wir unter werke. Im 
9 Anilin- und Soda-Fabrik , wurden da Chemikern Professor Demel und 
sie von Kommerzienrat 

10 eigenen Bereich mit mehreren den Farben gehalten sind, mit deren 
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11 leider etwas verspäten würde . Ich j zweiten Aviateur. „Campari, 
bestellte = Grapefruitsaft 
12 . Und du gibst das Ruder noch d Händen?““Ich würde gerne. Aber 
nicht aus en | ein 
13 Krawatte. Er nahm meinen Arm. d Blauen Salon gehen, es ist ange- 
„Laß uns in en | richtet 
14 angerichtet haben können, und es d Richtigen rauszufinden. Eben das 
geht nur darum, | sollst 
leidige Angelegenheit sprechen Jahren seit Klaras Tod so selten 
15 — wir haben in den Gelegenheit 
16 Hätte aufmerken sollen, als d Opfern sprach, die wir haben 
Korten von SR bringen und 
17 Erzahlen konnen und lief es dia Mokka aus, und Korten hob die 
bleiben. Ich trank | °° Tafel auf 
18 verabschiedete uns . Wir machten Je Weg ins Werk . Es waren nur ein 
uns auf paar Schritte 
19 dann war er weg. Frau nen N den | fünfziger Jahren Kortens 
benutzte Brille am goldenen Hals und war beschäftigt. Ich 
20 den 
Kettchen um stand am 


Die grammatikalischen Lernobjekte sind nach Mustern sortiert, sie erscheinen 
aber in aleatorischer Abfolge in unterschiedlichen Kontexten: die Grammatik- 
morpheme werden daher in einer natürlichen sprachlichen Umgebung wahr- 
genommen, nämlich als nicht saliente Elemente, sie treten aber gehäuft auf 
und werden unbewusst mitverarbeitet. 


Die dabei aktivierten kognitiven Fähigkeiten werden bei der Arbeit mit den 
Ergebnissen der Korpussuche im Detail erkennbar. Das rasche Aussortieren von 
nicht pertinenten Belegen im Hinblick auf ein Muster, das der Lernende selbst 
als Ausgangspunkt seiner Suche gewählt hat. Die dafür notwendige Aufmerk- 
samkeit, die auf formale Aspekte der Sprache in Mustern und Gruppen, auf die 
Gliederung nach Mehr-Wort-Konstruktionen ausgerichtet ist, kann den Blick 
schärfen für weitere rekurrente Strukturen, die in den Belegen zu erkennen sind. 
Der nach formalen und zugleich funktionalen Kriterien unterscheidende Blick 
wird durch Üben daran gewöhnt, immer umfassendere Elemente des Kontextes 
in die Analyse einzubeziehen und gewinnt Sicherheit im Suchen, im Erkennen 
von Regelmäßigkeiten, von Mustern und von Differenzen. 
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Diese kognitive Aktivitàt sind keine Leistungen, die nur von fortgeschrittenen 
Lernenden abverlangt werden können. In dieser Perspektive gewinnen sogar an- 
scheinend triviale Recherchen wie die nach einzelnen Präpositionen Kontur. Die 
Suche nach dem Lemma auf bietet schon auf der ersten Seite eine Fülle von Be- 
legen, die zur Musterdifferenzierung einladen. Auch Anfänger erkennen an re- 
kurrenten Morphemen wie der dem grammatikalische Formen und Formeln. 


TE] ISPA 
jselbs justiz Am Anfang habe ich ihn beneidet . Das war auf der Schule , auf dem Friedrich- Wilhelm-Gymnasium 
|selbs justiz ihn beneidet . Das war auf der Schule , auf dem Friedrich-Wilhelm-Gymnasium in Berlin 
jselbs justiz Friedrich- Wilbelm-Gymnassum in Berin . Ich trug Vaters Anzüge auf , hatte keine Freunde und kam nicht am 
Iselbs justiz heute selten dran . Mein Beruf hält mich auf Trab , und wenn ich abends noch kurz ins 
|selbs justiz noch kurz ins Büro schaue , tormen sich auf dem Schreibtisch keine Akten . Nur der 
Iselbs_justiz Besuche zu Weihnachten und zum Geburtstag auf . Wir verkehren in verschiedenen Kreisen 
lselbs justiz Schokoladenhömchen , und ich frühstückte draußen auf dem Gehsteig in der Sonne . Eine junge 
lselbs justiz hübscher , und ich stellte meine Einwegtasse auf das Schaufenstersims und ging hinter ihr 
selbs justiz Büro in der Augusta-Anlage . Ich bin stolz auf mein Baro . In Tür und Schaufenster des 
lselbs justiz Lettem : Gerhard Selb Private Ermittlungen Auf dem Anrufbeantworter waren zwei Anrufe 
kolbe justiz Sie sah mich mitfühlend an." Sie müssen auf Herm Generaldirektor warten ? * Ich hatte 
selbs justiz hängen würde ." Mein Beber Selb " , kam er auf mich zu . Klein und drahtig , mit wachsamen 
|selbs justiz Trinken ? * Er warf einen zweifelnden Blick auf mein Päckchen Sweet Afton . " Bringen Sie 
selbs justiz Robkostsalat essen , welcher Mitarbeiter gerade auf unserem Tennisplatz trainiert „ de intakten 
|selbs justiz ihn zu verachten , um so stolzer war er auf seine Enkelkinder . Marion war in die Studienstiftung: 
jselbs justiz den Mokka aus , und Korten hob die Tafel auf . Der Chef des Kasinos verabschiedete uns 
|selbs justiz Kasinos verabschiedete uns . Wir machten uns auf den Weg ins Werk . Es waren mur ein paar 
lselbs justiz em Gewirr von Türmen , Hallen und Rohren auf den Handelshafen und das dunstblasse Mannheim 
|selbs justiz zurückfordert . ` In ihrem Vorzimmer drückte sie auf den Knopf der Sprechanlage . ` Herr Direktor 
selbs justiz flink und der Hindedruck nicht fester . Auf semem Schreibtisch lag em dicker Ordner 


Fazit: Der eigentliche Gewinn der systematischen Korpusarbeit im Sprachun- 
terricht liegt also vielleicht gerade darin, dass ganz klar formulierte Ziele vor- 
gegeben werden, die zu klar bestimmten Ubungsanordnungen fihren. Korpus- 
recherchen sind Ubungen, die relevante Ziele verfolgen. Die Arbeit mit 
Korpora ist zugleich aufmerksames Beobachten des Sprachgebrauchs, Lernen 
und Uben. Der Akzent liegt auf dem Uben, der unbekannten Grofe allen 


Lernens. 
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Abstract 

Das DWDS-Wortprofil ist das Ergebnis einer automatischen syntaktischen und sta- 
tistischen Analyse sehr großer Korpora. Es liefert einen kompakten Überblick über 
die statistisch signifikanten syntagmatischen Beziehungen eines Wortes. Beispiele 
dieser sogenannten syntaktischen Relationen sind Attribut-Nomen Verbindungen wie 
schöne Bescherung oder Verb-Objekt Beziehungen wie Flasche entkorken. Die Darstel- 
lung der Relationen erfolgt in Form einer Schlagwortwolke oder in Tabellenform. Die 
Berechnung des DWDS-Wortprofils erfolgt in drei Etappen: Festlegung der zu ex- 
trahierenden syntaktischen Relationstypen, Extraktion der Relationen mittels einer 
automatischen syntaktischen Analyse und Bewertung der statistischen Signifikanz 
der extrahierten Relationen. Der derzeitige Prototyp des DWDS-Wortprofils beruht 
auf einer Mischung eines Referenz- und eines Zeitungskorpus, dem DWDS-Kern- 
korpus und dem ZEIT-Archiv (1946-2009), und hat eine Gesamtgröße von 500 Mil- 
lionen laufenden Textwörtern. Aus dem Korpus wurden etwa 90.000 Lemmata mit 
2.000.000 Relationen extrahiert. Erste Auswertungen zeigen, dass bereits der gegen- 
wärtige Prototyp eine große Reichhaltigkeit von Wortverbindungen enthält, die ihn 
auch im Vergleich mit großen einsprachigen Wörterbüchern interessant machen. Für 
den an der Textproduktion interessierten Nutzer bietet das Wortprofil aber einen weit 
über das gedruckte Wörterbuch hinausgehenden Mehrwert: Jede Relation des Wort- 
profils ist direkt mit den dazugehörigen Satzkontexten im Korpus verknüpft. Der 
Nutzer erhält somit unmittelbar einen Überblick über die weiteren semantischen und 
pragmatischen Kontexte in authentischen Texten. Dies kann gerade bei sprachlichen 
Unsicherheiten von erheblicher Hilfe sein. Das DWDS-Wortprofil ist über die Web- 
Plattform www.dwds.de abfragbar. 


1. Einleitung 

Elektronische Textkorpora werden seit über 20 Jahren in der Wortschatzfor- 
schung und für das Sprachlernen eingesetzt (z.B. Sinclair 1991, Braun et al. 
2006). Beispiele aus Korpora haben dabei im Unterschied zu Kompetenzbei- 
spielen den Vorzug, dass sie die verschiedenen Verwendungen des Wortes auf 
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der Grundlage realer Textbeispiele widerspiegeln. In der Regel basieren elektro- 
nische Plattformen, die diese Korpora analysieren, bei der Anzeige der Sucher- 
gebnisse auf Konkordanzen (s. Abb. 1). Damit kònnen die Gebrauchskontexte 
eines Wortes auf übersichtliche Weise dargestellt werden. Mit wachsender Grò- 
ße der Korpora - gängig sind mittlerweile Korpora einer Größe von mehreren 
hundert Millionen bis hin zu einigen Milliarden Textwörtern - steigt nicht nur 
der Variantenreichtum der Gebrauchskontexte, sondern auch die Anzahl der 
Belege für ein Suchwort bzw. einen Suchausdruck. In der Regel sind daher die 
Konkordanzanzahlen für eine Wortsuche zu groß für eine manuelle Auswer- 
tung. Beispielsweise haben die Wörter Feindbild oder grau im Archiv der ZEIT 
(1946-2009) Frequenzzahlen von 2364 bzw. 21656 Treffern (s. www.dwds.de). 


GD 06 ZET A ZEIT Online 


Treffer 2364 Bai 

1 2009 dass Ihnen nach dem Abgang vom George W. Bush das Feindtid fetit? Goebel Nein 

2 2009 ASO wong überraschen. schileGiich sind Feinde aut FeInctiider = angemttzen, und umspekemet Rue sich auch Ahmadin 
3 2009 heute dient sie dem Anti-Drogen-Krieg dem newen  Feindtid mit dem das Pentagon seine Miltärpräsenz in Latei 

4 2008 ner Ze. in der die » reiche deutsche Wiwe « als Feindtild fungiert Das Gespräch vor dem Werk kommt immer 
5 2000 Spiegel Die Schartmacher in Teheran verlieren en = Feindtld = Man Mat Barack Obama einen Prasicenten Ger sof po 
6 2008 rich den Scharfmacher in Teheran, die gerade en Feindisid verberem waw ceil de/audio Diesen Ahel fn 

7 2009 Natürlich mutzi Ge Regerung den Westen auch ats = Feindtald um sich intem zu stärken. Aber in den vergani 

8 2009 Merwene nicht mehr von Verschwörungsformeln und Feindtidern , die ebenso gut von rechtsausen kommen könnten 
9 2009 ‚on. Auch das lit neu in Lateinamerika: Das ame Feindtid USA dient unter Barack Obama nicht mehr zum Sünden 
10 2009 und blüht der Mythos vom freien Internet. und die —Feinchilder sind klar. Auf der einen Seite stehen die » kon 

11 2009 Oht well cas Regime von dem Fontal des bequemen | Falnobigas on see renee BEE Sr 

12 2009 it Von Michael Thumann Konservative benarren aut Feindtid Ahmadineschad Die Verteefung Irans ist vorbei, Ba 
13 2009 jarat - konservata Konservative beharren aut = Felndbild  Ahmadineschad Iran-Politix Von Michael Thamann 

14 2009 ud Anmadineschag der so bereitwillig das perieise Feindzdd abgitt mit seiner schlechten Polk seinem schée 

15 2009 war vor allem das weithin geteilte cAmonizierence Feindtld = Metzere » UnterchOcker «, » Henker « in ce 

16 2000 Ser galang as, nach desem Kulturschock Europa als Faindbild = 2uportratieren OVP und SPO sind miverantwort 

#7 2009 ‚ezeichmet Poltiter, die sich Manager als atue Feindeilder aussuchen, vergessen, dass Elten in anstandiger W. 
10 2009 ise heute) das Angstschuren vor SchwareGeld, das Feindtdd (Pau Kirchhofari-Theocor zu Guttenberg), die Hà 

19 2009 in seinem Leben verdienen kann, befem ein Mares  Feindbid Zumal ste sich in Netzwerken gegenseltg shit 
20 2009 ans: Es sind unsere. Nur die Konstruktionen von Felnabildem „ob sie sich nun gegen Juden, Muslime ager Amarik 


Treffer pro Seite: | 10 || 0 || 50 || 100 || 500 


Abb. 1: Konkordanzzeilen für das Substantiv Feindbild 


In Abb. 1 sind die ersten 20 der 2364 Konkordanzzeilen für das Substantiv 
Feindbild dargestellt. Das Wort Feindbild kommt hier in sehr unterschiedli- 
chen syntagmatischen Kontexten vor. Bei der Frage jedoch, ob und welche 
dieser Kontexte typisch sind, geben Konkordanzzeilen keine unmittelbare Hil- 
fe. Wie kann man beispielsweise durch das Lesen von Konkordanzzeilen her- 
ausfinden, mit welchen Adjektiven das Substantiv Feindbild typischerweise 
verwendet wird oder umgekehrt, ob bzw. wie gebräuchlich in Abbildung 1 die 
Adjektive perfekt (Treffer 14), dämonisierend (15), neu (17) oder klar (19) für 
das Substantiv Feindbild sind? Ähnliche Fragen stellen sich für verbale Konst- 
ruktionen wie auf einem Feindbild beharren (12,13), auf Feindbilder angewiesen 
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sein (2), oder ein Feindbild verlieren (5) bzw. ein Feindbild abgeben (14). Um 
diese Fragen „per Kopf“ zu beantworten, müsste man die über 2300 Konkor- 
danzzeilen durchlesen und Strichlisten über die entsprechenden Konstruktio- 
nen führen. Es ist unmittelbar einleuchtend, dass die Beantwortung dieser 
Fragen bei noch häufigeren Wörtern oder bei noch größeren Korpora noch 
aufwändiger zu beantworten wäre. 
Church & Hanks (1989) waren die ersten, die zeigten, dass lexikalische Statis- 
tiken sinnvoll sind, um Konkordanzzeilen auf typische Verwendungsweisen 
hin zu analysieren. Sie verwenden dabei das statistische Maß der Mutual In- 
formation, das vereinfacht gesprochen, Worte in einer gewissen Nachbarschaft 
des Suchwortes (in der Regel zwischen 5 und 10 Wörtern oder auch innerhalb 
des ganzen Satzes) daraufhin bewertet, ob sie statistisch gesehen überpropor- 
tional häufig mit dem Suchwort erscheinen. Eine Reihe von Datenbanken 
verwenden diese oder vergleichbare Kookkurrenzstatistiken, um die Gebräuch- 
lichkeit von Wortverbindungen zu bewerten. Ein gutes Beispiel hierfür liefert 
das weit verbreitete Portal „Deutscher Wortschatz“, welches zu einem Such- 
wort die statistisch signifikanten Kookurrenzen aufführt und darüber hinaus 
auch die signifikanten linken und rechten Nachbarn (s. Abb. 2) 
Signifikante Kookkurrenzen für Feindbild: 

ein (99), als (73), das (71), eins (68), neues (65), klares (54), Nummer (49), dient (45), Saudische (45), 

neoliberales (43), islamischen (42), irrsinnigen (42), auserkoren (41), Islam (40), : (40), geworden 

(38), Türk (35), Globetrotter (35), , (34), zum (33), Steuerstaates (32), SchmAhgestinge (30), Juden 

(30), aufbaue (26), Westen (26), aufzubauen (25), gemeinsames (25), herhalten (25), dargestellt (24), 

willkommenes (24), Bayern-Fans (23), abgemutzt (23), löst (23), Jude (22), Bruchhagen (22), 

SPD-Arbeitsmarktexperte (21), Bill (21), Aug (20), Verhöhnung (20), aufgeheizten (20), Gates (19), 

Massen (19), Zelt (19), Terror (19), sein (19), zurecht (18), Sarkozy (17), Profilierung (17), 

Staatsmacht (17), entdeckt (17), beliebtes (16), ins (16), 68er (16), Amerika (16), Bushs (15), Brandner 

(15), Wanken (15), Israel (14), rückt (14), geliefert (14), USA (14), Husseins (14), entzündet (14), 

schlechthin (14), ist (14), Kuwait (13), Vernichtung (13), alte (12), Klientel (12), Mittleren (12), Kalten 


(12), parat (12), Gegners (12), größtes (12), vorm (12), Kapitalismus (11), Boll (11), Naturschutz (11), 
ausmachen (11), wilden (11) 


Signifikante linke Nachbarn von Feindbild: 
das (187), als (149), zum (149), neues (122), klares (95), ein (91), neoliberales (60), gemeinsames 
(48), alte (46), willkommenes (36), kein (35), sein (32), beliebtes (28), Das (28), gutes (26), größtes 
(24), wilden (23), großes (15), weiteres (15), ihr (12), " (11), dem (7), ins (6), vom (4) 


Signifikante rechte Nachbarn von Feindbild: 
Nummer eins (141), Nummer (113), herhalten (43), Islam (41), Bruchhagen (39), herhalten müssen 
(37), zurecht (36), geworden (36), entdeckt (35), auserkoren (30), USA (20), Israel (19), geliefert (19), 
geriet (19), dient (19), vieler (17), des (17), ab (17), " (15), Westen (14), Staat (13), gefunden (12), 
eines (10), der (9), vom (8), : (7), . (5), war (4) 


Abb. 2: http://wortschatz.uni-leipzig.de (Abfrage vom 30.11.2010) 


Zwar liefert eine rein statistische Methode einen sehr schnellen Überblick über 
die signifikanten Wortpaare innerhalb eines Satzes. Die Reihenfolge scheint je- 
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doch, was den syntaktischen Bezug zum Suchwort Feindbild angeht, zu einem 
gewissen Grade beliebig. So lasst sich zwar vermuten, dass die Artikel ein, das 
und die Adjektive neues und Alares in Zeile (1) der Abbildung 2 einen klaren lo- 
kalen Bezug zum Suchwort haben, z.B. ein Feindbild, neues Feindbild, klares 
Feindbild. Schon weniges klar sind aber beispielsweise die Kookurrenzen in Zeile 
(3): Türk, Globetrotter oder Schmähgesänge. Die syntagmatischen Bezüge lassen 
sich hier nur erraten. Im Beispiel Feindbild ist diese syntaktische Unordnung 
noch durch etwas mehr Leseaufwand in den Griff zu kriegen, da es sich hier nur 
um etwa 50 Kookurrenzen handelt. Wirklich problematisch wird es jedoch bei 
Suchwörtern, die mehrere hundert oder sogar über 1000 Kookurrenzen haben. 
Dies ist kein so seltener Fall, wie in Abschnitt 4.2 erläutert wird. Man wird daher 
für die Beantwortung der oben gestellten Fragen nach typischen syntaktisch mo- 
tivierten Wortverbindungen andere Verfahren benötigen, die auch syntaktische 
Informationen nutzen. 

Ein für die syntagmatische Analyse weitergehender Ansatz stellt die von Adam 
Kilgarriff eingeführte Sketch Engine dar (Kilgarriff 2004). Die Sketch Engine 
geht über reine Kookkurrenzstatistiken insofern hinaus, als sie nur diejenigen 
Kookurrenzen berücksichtigt, die in einer vordefinierten syntaktischen Relation 
stehen. Solche Relationen können beispielsweise Adjektiv-Nomen, Verb-Ob- 
jekt, Genitivattribute von Nomen oder Verb-Präpositionalphrasen Verbindun- 
gen sein. Sketch Engine Plattformen gibt es für so verschiedene Sprachen wie 
Englisch, Tschechisch, Japanisch oder Chinesisch. Eine einfache Übertragung 
des Sketch-Engine Ansatzes z.B. vom Englischen auf das Deutsche, ist aus we- 
nigstens den beiden folgenden Gründen schwierig: die freie Wortstellung im 
Deutschen und der Kasussynkretismus führen dazu, dass eine Extraktion von 
syntaktischen Relationen auf der Basis von Wortarten und darauf basierenden 
Satzmustern, anders als im Englischen, zu keinen befriedigenden Ergebnissen 
führt. So haben Experimente mit der Sketch Engine für das Deutsche gezeigt, 
dass je nach Parametrisierung der Regeln, entweder die Analysegenauigkeit un- 
zureichend ist oder aber die Abdeckung, d.h. der Anteil des analysierbaren 
Texts, zu gering ist (Kilgarriff 2004, Ivanova et al. 2008). Aus diesem Grund be- 
ruhen die beiden existierenden Ansätze für das Deutsche zur Extraktion von 
syntaktischen Relationen aus großen Textkorpora auf einem allgemeineren For- 
malismus, der syntaktische Satzfunktionen erkennen und lokale Mehrdeutigkei- 
ten auflösen kann. Der erste, an der Universität Stuttgart entwickelte Ansatz zur 
Extraktion „signifikanter Wortpaare als Webservice“ (Fritzinger et al. 2009), be- 
ruht dabei auf dem Dependenzparser FSPAR (Schiehlen 2003), der zweite an 
der Berlin-Brandenburgischen Akademie der Wissenschaften (BBAW) entwi- 
ckelte Prototyp, das DWDS-Wortprofil (Geyken et al. 2009), basiert auf Syncop 
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(Didakowski 2007), einem auf syntaktischem Tagging beruhenden Parsing-For- 
malismus. 

In diesem Beitrag soll das DWDS-Wortprofil aus Nutzersicht erliutert werden. 
Dazu werden wir die Abfragefunktionalitàt, so wie sie sich für den Nutzer auf 
der Web-Plattform des DWDS prisentiert, am Beispiel des eingangs erwahnten 
Wortes Feindbild illustrieren (Abschnitt 4.1) und in Abschnitt 4.2 eine erste Ein- 
schatzung der Qualität des Wortprofils anhand des Vergleichs mit einem großen 
einsprachigen Wörterbuch gegeben werden. Abschnitt 5 gibt einen Ausblick auf 
die Potentiale des Wortprofils. Zuvor werden in Abschnitt 2 die Methode zur 
Erstellung von Wortprofilen und in Abschnitt 3 das derzeit verwendete DWDS- 
Wortprofil sowie dessen Datengrundlage beschrieben. 


2. Das DWDS-Wortprofil 

Das DWDS-Wortprofil ist das Ergebnis einer automatischen syntaktischen 
und statistischen Analyse schr großer Korpora. Es liefert einen kompakten 
Überblick über die statistisch signifikanten syntagmatischen Beziehungen ei- 
nes Wortes mit anderen Wörtern in Form einer Schlagwortwolke oder in Ta- 
bellenform. Die Berechnung des DWDS-Wortprofils erfolgt in drei Etappen, 
die in den folgenden Abschnitten näher beschrieben werden: Festlegung der 
zu extrahierenden syntaktischen Relationstypen, Extraktion der Relationen 
mittels einer automatischen syntaktischen Analyse und Bewertung der statis- 
tischen Signifikanz der extrahierten Relationen. 


2.1. Festlegung der syntaktischen Relationen 

Die Festlegung der syntaktischen Relationstypen erfolgt außerhalb der Be- 
rechnung der Relationen durch den Syntaxparser Syncop (s. Abschnitt 2.2), da 
die Relationstypen bestimmen, welche Analysen des Parsens in das Wortprofil 
einfließen. Die Liste der Relationstypen beruht auf den in Foth (2005) ver- 
wendeten Etiketten zur Markierung von Dependenzrelationen, die wiederum 
von SynCop verwendet werden. Typische im Wortprofil verwendete Etiketten 
sind ATTR oder OBJD. ATTR steht für eine Attribut-Relation zwischen 
Adjektiv und Nomen, OBJD für eine Dependenzrelation zwischen einem 
Verb und einer Nominalphrase im Dativ. Mit OBJD werden aus Gründen der 
Einfachheit für die Notation sowohl Dativobjekte als auch fakultative Ergän- 
zungen oder freie Angaben zusammengefasst, da der Syncop über keine Verb- 
semantik verfügt und somit nicht entscheiden kann, ob es sich bei der depen- 
denten Nominalphrase um ein Objekt oder nur eine fakultative Ergänzung 
oder Angabe handelt. Nicht alle für das Parsing verwendete Etiketten sind für 
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den Benutzer des Wortprofils relevant. Dies gilt beispielsweise für die Relation 

DET, die einen Artikel mit einem Nomen verbindet, die Relation APP, die 

festlegt ob eine Abfolge von Wörtern zu einer Nominalphrase gehören oder 

die Relation NEB, die das Verb eines Nebensatzes mit dem übergeordnete 

Wort verbindet. Diese Relationen sind zwar für den Parsing-Prozess wichtig, 

stellen aber für das Wortprofil nur Zwischenergebnisse dar. 

Derzeit werden die folgenden Relationstypen für das DWDS-Wortprofil ver- 

wendet: 

Relationstypen innerhalb von Phrasen 

e Adjektiv-Nomen (Etikett: ATTR): kares Feindbild, schöne Bescherung 

. Nomen-Koordination-Nomen (CJ): grün und blau, Kopf oder Zahl 

e Nomen-Nomen (im Genitiv) (GMOD): Abbau des Feindbildes, Abbau 
von Vorurteilen 

° Adverb-Adjektiv (ADVA): sehr intelligent, hoch erfreut 

Phrasenübergreifende Relationen 

° Nomen -Verb (SUBJ): das Feindbild verblasst, das Badewasser läuft aus 

. Nomen-Verb (PSUBJ): die Flasche wurde entkorkt 

. Nomen -Verb (OBJA): ein Feindbild abbauen, eine Rede halten 

. Nomen -Verb (OBJD): dem Publikum verkünden 

. Verb-Präposition-Nomen (V PP): zur Verfügung stehen, auskommen ohne 
Feindbild 

° Verb-Verb (INFOBJ): aufgehen sehen, (auf etw.) zu sprechen kommen 

° Adverb Verb (VADV): schallend lachen, freimütig zugeben 


2.2. Extraktion der syntaktischen Relationen 

Wie bereits in Abschnitt 1 erwähnt, ist es für das Deutsche im Unterschied 
zum Englischen notwendig, die Extraktion syntaktischer Relationen auf der 
Basis eines syntaktisch voranalysierten Texts durchzuführen. Die syntaktische 
Analyse kann dabei aufgrund der speziellen Charakteristika des Deutschen 
(lange Abhängigkeiten und relative freie Wortstellung), nicht auf „flachen“ Se- 
quenzabfolgen von Wortarten beruhen, sondern muss in der Lage sein, De- 
pendenzinformationen für phrasenübergreifende Relationen aufzubauen. Ein 
solches Verfahren, welches sowohl syntaktische Satzfunktionen erkennen und 
lokale Mehrdeutigkeiten auflösen kann, ist das für das DWDS-Wortprofil 
verwendete Analysewerkzeug Syncop. Hier soll die Grundidee des Verfahrens 
dargestellt werden. Eine vollständige technische Beschreibung von Syncop 
findet sich in Didakowski (2007). 

Das Parsing-Verfahren von Syncop beruht auf fünf Modulen, die sequenziell 
auf die Korpustexte angewandt werden: 
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(1) Satzsegmentierung und morphologische Analyse mit der TAGH-Mor- 
phologie (Geyken & Hanneforth 2005) 

(2) Ermittlung der Phrasen und Annotation der darin enthaltenen Modizie- 
rer/Koordinationsfunktionen 

(3) Ermittlung von dependenten bzw. koordinierenden Phrasen 

(4) Ermittlung von Nebensätzen und Annotation der darin enthaltenen syn- 
taktischen Köpfe 

(5) Ermittlung von Hauptsätzen und Annotation der darin enthaltenen syn- 
taktischen Köpfe 


Bestandteile dieser Module sind außerdem: 

e Die Auflösung von Kasus-Numerus-Genus Kongruenz. Dies ist für die 
Zuordnung von Attributivphrasen genauso wie für Subjekt-Verb Relatio- 
nen von Bedeutung, 

° Die Erkennung von Verb-Partikeln, die für die korrekte Lemmatisierung 
komplexer Verben in Verbzweitstellung notwendig ist, 

. Präferenzregeln zur Auflösung mehrdeutiger globaler Satzanalysen, 

° die Möglichkeit, syntaktische Regeln zu verletzen, um auch halb- oder 
ungrammatische Korpussätze zumindest partiell analysieren zu können. 


Wie eingangs erwähnt, basieren Wortprofile auf sehr großen Korpora mit „real 
existierenden“, d.h. im Allgemeinen auch sehr komplexen oder unvollständi- 
gen Sätzen. Das Parsing-Verfahren zur Extraktion von Wortprofilen muss so- 
mit sowohl robust als auch effizient sein. Die Robustheit bedeutet in diesem 
Zusammenhang, dass das Verfahren nicht abbricht, wenn es bei einem kom- 
plexen Satz keine vollständige Satzanalyse liefern kann, sondern sich gegebe- 
nenfalls auch damit begnügt, partielle Analysen von Phrasen oder unterspezi- 
fizierte Satzfunktionen als Analyse zurückzugeben. Die Effizienz des 
Verfahrens wird dadurch gewährleistet, dass Syncop nicht beliebig eingebette- 
te Sätze extrahiert — dies ist nur mit rekursiven Verfahren möglich -, sondern 
nur Sätze mit einer beschränkten Einbettung analysiert. Für praktische Zwe- 
cke der Korpusannotation ist dies aber durchaus ausreichend (Koskenniemi 
1990). 

Wie sich dies auf die Satzanalyse sowie die daraus zu extrahierenden syntakti- 
schen Relationen auswirkt, soll an dem folgenden im DWDS-Kernkorpus 
enthaltenen Satz illustriert werden. Schwierigkeiten dieses Satzes sind die 
„langen“ Abhängigkeiten der passivischen Subjektfunktion (Aspekt, beleuchtet), 
die Passivierung des Gesamtsatzes sowie die komplexen Koordinationen (As- 
pekt, Folgen, A uswirkungen). 
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„Jeder Aspekt des Vertrags von Rom .. und alle Folgen und Auswirkungen, die 
ein britischer Beitritt nach sich ziehen diirfte, sind von allen Seiten beleuchtet 
worden.“ Hervorhebung (A.G.) (Archiv der Gegenwart 36, 1966) 

Von Syncop wird dieser Satz folgendermaßen analysiert (die Analyse be- 
schränkt sich dabei auf die für die Extraktion wichtigen Satz- und Koordina- 
tionsrelationen). 

[[Jeder@DezN Aspekt@HEAD] „es UB] [des@DN Vertrags@HEAD] „ECN la 
und@CC [alle@DN Folgen@ HEAD und@CC Auswirkungen@HEAD], @SUBJ 
sind@FAUXV ... beleuchtet@FMAINV worden@FAUXV .] , gi 

In dieser Klammernotation werden syntaktische Funktionen (Kopf- und Modifi- 
ziererrelationen) durch das Symbol @ markiert. Im Beispiel steht dabei @HEAD 
für die Kopffunktion, @Subj für die Subjektrelation, @CC für die Koordination, 
die anderen Funktionen stehen für Modifiziererrelationen: @DN für eine Nomen- 
Determinierer Relation, @GN für die Nomen-Genitiv Relation, @FMAINV für 
das Hauptverb, @FAUXV für die Verb-Auxiliar-Relation. Die Markierung der 
Sätze und Phrasen werden mit eckigen Klammern notiert: Im Beispiel gibt es ei- 
nen Satz, der als Passiv-Klausel markiert (cl_passive) ist und drei Phrasen, die je- 
weils als Nominalphrase (NP) annotiert werden. Zur einfacheren Lesbarkeit ist die 
Klammernotation in Abbildung 4 in der Dependenzansicht dargestellt. 


beleuchten 
auxiliary F- i N audliary 
g di subject a 

re Sp 
worden und sind 
— a coordinado ™ < 

Aspekt und 
determiner 4 = \ genitive determiner „~ ZA NS „coordination 


a VA N 
A /coordination ~ 


x À e ` 
Jeder Vertrags alle Folgen Auswirkungen 


determaner 


des 
Abb. 3: Dependenzbaum 


Aus der Satzanalyse des Beispielsatzes durch den Syncop-Parser lassen sich 
die folgenden syntaktischen Relationen (s. 2.1) für das Wortprofil extrahieren, 
wie sich dem Dependenzbaum ablesen lasst: 

e PSUBJ: (Aspekt , beleuchten) 

. GMOD: (Aspekt, Vertrag) 


Statistische Wortprofile zur schnellen Analyse der Syntagmatik in Textkorpora 


. CJ: (Aspekt, Folge) 

° CJ: (Aspekt, Auswirkungen) 

. PSUBJ: (Folge, beleuchten) 

° PSUBJ: (Auswirkung, beleuchten) 


Zusammenfassend lässt sich somit festhalten, dass das Analysesystem Syncop 
in der Lage ist, Phrasen, Hauptsätze (Klauseln) und Nebensätze (Sub-Klau- 
seln) eines Satzes zu markieren sowie die dazugehörigen syntaktischen Funk- 
tionen (Kopf- und Modifiziererrelationen) zu ermitteln. Dabei gilt folgende 
Einschränkung: Bei komplexen oder unvollständigen Sätzen versucht Syncop 
nicht, eine vollständige Syntaxanalyse des Satzes zu erzeugen, sondern gibt 
auch partielle Analysen zurück. Aus den Analysen wiederum werden die syn- 
taktischen Relationen extrahiert. 


2.3. Berechnung der statistischen Salienz 

Die extrahierten syntaktischen Relationen werden mittels eines statistischen 
Verfahrens bezüglich ihrer statistischen Signifikanz gewichtet. Dafür werden die 
aus den Texten extrahierten Relationen aufsummiert und danach bewertet, ob 
sie überproportional häufig vorkommen. Wichtig hierbei ist, dass für die Zäh- 
lung weder einfache Wortformen noch Lemmaformen, sondern Lemma-Wort- 
art-Paare verwendet werden. Ein Lemma-Wortart-Paar ist beispielsweise (grau, 
Adjektiv) wie in graue Eminzenz oder (grau, Modifizierer) wie in grau meliert. 
Der Grund, weshalb man Lemma-Wortart-Paare und nicht einfach Lemmata 
verwendet, besteht darin, dass Lemmata bezüglich ihrer Wortart mehrdeutig 
sein können und somit andere Relationstypen besitzen. Beispielsweise ist (grau, 
Adjektiv) Attribut eines Nomens, wohingegen (grau, Modifizierer) Attribut ei- 
nes Adjektivs ist. Diese Vermischungen umgeht man, indem man für die Lem- 
ma, Wortart — Paare unterschiedliche Relationstabellen aufbaut. 

Das im DWDS-Wortprofil verwendete Maf der Salienz (Lin 1998) ist eine 
Erweiterung der Mutual Information (MI). Bei der Salienz wird wie ftir die 
MI berechnet, ob eine Wortkombination im Korpus „häufiger als erwartet“ 
vorkommt. Allerdings bezieht die Salienz hierbei nicht die relativen Häufig- 
keiten über das gesamte Korpus mit ein, sondern schränkt diese auf den spezi- 
fischen syntaktischen Relationstyp ein, über den die Wortkombination in Ver- 
bindung steht. Formal ausgedrückt wird die Salienz eines Tripels (w, r,w‘) wie 
folgt definiert: 

IIw,r,w’]l x ls nll 


Sal (w,r,w') — (1) 


lwr] x [ls rw 
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In der Formel (1) sind w und w’ Lemma-Wortart-Paare, r ein syntaktischer 
Relationstyp. Ilw,r,w'Il steht für die Anzahl der Vorkommen des Tripels 
(w,r,w') im annotierten Korpus. '*' ist ein Platzhalter für eine beliebiges 
Lemma-Wortart-Paar, und IIw,r,*|| ist definiert als die Summe der Häufig- 
keiten über alle Lemmata wj’ mit ||w,r,w;'||. Entsprechend wird Il*,r,*Il defi- 
niert als die Summe über alle Tripel (w,r,w;'), die miteinander über die Rela- 
tion r in Verbindung stehen. Diese Formel entspricht der Formel, die Church 
& Hanks (1989) für die MI vorgeschlagen haben mit dem zusätzlichen Faktor 
I», r,*Il. In Übereinstimmung mit Kilgarriff (2004) lässt sich feststellen, dass 
das Maß der Salienz im Vergleich zum Maß der MI den Vorteil hat, Tripel 
mit geringer Häufigkeit nicht überzubewerten. 


3. Datengrundlage und Parametrisierung des 
DWDS-Wortprofils 

Die Korpora, die als Datengrundlage des DWDS-Wortprofils dienen, sind 
grundsätzlich frei wählbar. Die Zusammensetzung und Größe der Korpora 
spielen für das Wortprofil jedoch eine wichtige Rolle. 

Die Zusammensetzung der Korpora ist insofern relevant, als die extrahierten 
syntaktischen Relationen die im Korpus vorkommenden syntaktischen Nach- 
barn des Wortes widerspiegeln. Daher erhöht ein breit gestreutes, nach Text- 
sorten ausgewogenes Korpus, ein sogenanntes allgemeinsprachliches Refe- 
renzkorpus, die Qualität des Wortprofils in Bezug auf die allgemeinsprachliche 
Aussagekraft. Spezialkorpora oder spezielle Zeitungskorpora werden somit 
andere Wortprofile liefern als Referenzkorpora. 

Auch die Korpusgröße hat einen großen Einfluss auf die Wortprofile, denn 
Wortprofile sind in der Regel nur aussagekräftig, wenn das Lemma wenigstens 
500, besser jedoch 1000 Mal im Korpus auftaucht (siehe auch Ivanova et al. 
2008). Unter dieser Zahl ist die Aussagekraft eines Wortprofils nur begrenzt, 
da viele syntaktische Relationen dann in der Regel nur ein oder zwei Mal vor- 
kommen und somit kaum nachweisbar ist, dass es sich bei den extrahierten 
syntaktischen Relationen um typische Beispiele und nicht um Zufallsfunde 
handelt. Insofern spielt auch die absolute Korpusgröße eine Rolle, als sich mit 
wachsender Korpusgröße auch die Anzahl der verschiedenen Wörter erhöht, 
die hochfrequent im Korpus vorkommen. Dabei stellt sich heraus, dass eine 
Korpusgröße von 100 Millionen laufenden Textwòrtern zu klein ist, um eine 
für die zu erwartende Benutzungssituation ausreichende Anzahl von Wortpro- 
filen zu extrahieren. So gibt es beispielsweise im 100 Millionen Textwòrter um- 
fassenden DWDS-Kernkorpus (s. unten) nur etwa 5.000 Lemmata, die mehr 
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als 1.000 Mal vorkommen. Daraus ergibt sich, dass man weitaus grofere Kor- 
pora benötigt, wenn man qualitativ ausreichende Wortprofile für eine Stich- 
wortanzahl erstellen möchte, die zumindest der eines Kompaktwörterbuchs 
entspricht. 

Für das Deutsche liegen bislang keine Referenzkorpora geschriebener deutscher 
Standardsprache mit einer nach Textsorten ausgewogenen Verteilung vor!. Bei 
der Erstellung eines hinreichend großen Wortprofils ist man somit entweder auf 
Spezialkorpora oder auf eine Mischung aus Referenz und Zeitungskorpora an- 
gewiesen. Der derzeitige Prototyp des DWDS-Wortprofils (fortan kurz: Wort- 
profil) beruht auf einer Mischung eines Referenz- und eines Zeitungskorpus 
mit einer Gesamtgröße von 500 Millionen Tokens: dem DWDS-Kernkorpus, 
einem nach Textsorten ausgewogenen und zeitlich gleichmäßig gestreuten Re- 
ferenzkorpus der deutschen Sprache des 20./21. Jahrhunderts (Geyken 2007, 
www.dwds.de/textbasis), ca. 110 Millionen Tokens) und dem ZEIT-Archiv 
(1946-2009, ca. 400 Millionen Tokens, www.zeit.de). Daraus wurden für etwa 
90.000 Lemmata Wortprofile extrahiert mit etwa 2.000.000 syntaktischen Rela- 
tionen. Knapp ein Fünftel aller Wortprofile basiert auf Lemmata, die mindes- 
tens 1000 Mal im Korpus vorkommen, also gemäß des 0.g. Schwellwerts ausrei- 
chend für ein umfassendes Wortprofil sind. Als Schwellwert für die 
Mindestanzahl des Vorkommens einer syntaktischen Relation wurde die Zahl 4 
gewählt. Damit soll verhindert werden, dass okkasionelle Verbindungen fälschli- 
cherweise in das Wortprofil aufgenommen werden. Ob der Schwellwert von 4 
zu hoch ist, lässt sich nur experimentell und in Abhängigkeit von einer Frage- 
stellung beantworten. In der Folge soll die Nutzung sowie die Qualität des ge- 
genwärtigen Wortprofils anhand einiger Beispiele illustriert werden. 


4. Beispiele einiger Wortprofile 

4.1. Feindbild 

Das DWDS-Wortprofil kann über die Webseite des lexikalischen Informations- 
systems DWDS (www.dwds.de) genutzt werden. Im DWDS-Informations- 
system werden für ein Suchwort, welches der Benutzer in die Suchmaske ein- 
gibt, die Ergebnisse in mehreren Fenstern (panels) präsentiert. Es gibt drei 
Typen von Fenstern: Wörterbuch-, Korpus- und Statistikfenster. Die Fenster 
lassen sich frei zu sogenannten Sichten (views) zusammenstellen. Das DWDS- 


1 Die Situation ist anders, wenn man Webcorpora betrachtet, also Korpora, die mit Crawling-Techniken aus 
dem Web gewonnen wurden. Dafür gibt es für das Deutsche bereits ein 1,6 Milliarden Token großes Korpus 
(Pomikalek et al. 2009). Allerdings bleibt zu zeigen, dass dessen Aussagekraft vergleichbar mit einem Korpus 
ist, dessen Quellen sich aus gesicherten, redaktionell bearbeiteten Texten speist. 
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Wortprofil ist eines der Fenster und Teil der Standardsicht des DWDS-Infor- 
mationssystems. 

Anhand des bereits in Abschnitt 1 erwähnten Wortes Feindbild sollen die ver- 
schiedenen Recherchemöglichkeiten mit dem Wortprofil im DWDS-Infor- 
mationssystem illustriert werden. Die Standardansicht des Wortprofils erfolgt 
in Form einer Schlagwortwolke (Abb. 4). Man sieht, wie bei Schlagwortwol- 
ken üblich, signifikante Begriffe in einer größeren Schrift als weniger signifi- 
kante. Dabei basiert die Signifikanz auf der in Abschnitt 2.3 erläuterten Sa- 
lienz: je salienter eine syntaktische Relation, desto größer die Schriftart. Im 
Unterschied zu einer klassischen Schlagwortwolke werden hier somit die Be- 
griffe über die reine statistische Signifikanz auch nach der syntaktischen Rele- 
vanz gewichtet (s. Abschnitt 1). 

Für das bereits weiter oben erwähnte Wort Feindbild werden im DWDS- 
Wortprofil 32 verschiedene syntaktische Relationen mit insgesamt 384 Vor- 
kommen extrahiert. Die Voraussetzung für die Aufnahme einer Relation in 
das Wortprofil ist, dass dafür wenigstens vier Belege im Korpus vorkommen. 
Abgedruckt ist die im Korpus am häufigsten verwendete flektierte Form. 


# DWDS-Wortprofil 


Wortprofil für Feindbild als Substantiv Frequenz:384 Relationenfilter 


Abbau verlust Vo ru rtel le abzubauen alten 
antibolschewistische aufbaut auskommt_ohne bleiben braucht 
falschen gemeinsame gepflegte ideale ideologische intaktes klares 
klassischen linke nahmen neues primitive richtiges schafft schlichten 


stimmt taugt_als verblaßt westlichen Ängste äußere überkommene 


Wortart: Substantiv Zeige Tags Tabellenansicht 


Abb. 4: Wortprofil in Schlagwortwolkenansicht 


Neben der Darstellung in Form der Schlagwortwolke kann das Wortprofil 
auch in der klassischen Tabellenansicht präsentiert werden (Abb. 5). 
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DWDS-Wortprofl te 
relevanteste symtaktische Relationen für Felndbild als Substantiv 2384 Relationenfilter 
Stammfoem Wortant symaktische Relation Salemo © Froquenz 


Vorurted Suostarta 


11,42 


Abb. 5: Wortprofil in Tabellenansicht 


In der Tabellenform werden in der ersten Spalte alle statistisch signifikanten 

Wortformen aufgeführt (Spalte Stammform). Spalte 2 verzeichnet die Wort- 

art, bei mehreren Wörtern auch den Phrasentyp (beispielsweise PP, s. letzte 

Zeile der Abbildung). In Spalte 3 ist der syntaktischen Relationstyp beschrie- 

ben. Die Wortformen in Spalte 1 sind nach absteigender Salienz (s. Spalte 4) 

geordnet. Durch Klick auf die Spaltenüberschrift „Frequenz“ (Spalte 5) wäre 

auch eine Sortierung nach der Frequenz möglich. 

Die syntaktisch relevanten Nachbarn von Feindbild sind in den folgenden syn- 

taktischen Relationstypen zu finden: 

. Adjektiv-Nomen (Etikett: ATTR): altes, antibolschewistisches, gemeinsa- 
mes, gepflegtes, ideales, ideologisches, intaktes, klares, klassisches, linkes, neues, 
primitives, richtiges, schlichtes, verblasstes, westliches, äußeres, überkommenes 
Feindbild 

° Nomen-Nomen (im Genitiv) (GMOD): Abbau, Verlust 

. Nomen-Koordination-Nomen (CJ): Vorurteil 

° Nomen-Verb (SUBJ): bleiben, stimmen, verblassen 

° Nomen-Verb (OBJA): abbauen, aufbauen, brauchen, nehmen, schaffen 

. Verb-Präposition-Nomen (V PP): auskommen_ohne, taugen_als 

Die Relationstypen lassen sich über das Wortprofil-Fenster ansteuern, indem 

man den Relationenfilter anklickt (Abb. 4). Es werden dann die syntaktischen 

Relationstypen aufgeklappt (Abb. 6). Klickt man dann auf eine der Relations- 

typen, beispielsweise auf „Attribut“, erhält man alle Wortformen, die in einer 

Attributrelation (Adjektiv-Nomen) zum Wort Feindbild stehen. Diese Filter 

können bei hochfrequenten Wortprofilen sehr nützlich sein. Beispielsweise hat 

das geläufige Substantiv Haar 13509 Relationen (davon 532 verschiedene) im 

DWDS-Wortprofil. Eine Darstellung als Schlagwortwolke wäre hier sehr un- 

übersichtlich. Durch das Filtern nach einzelnen Relationstypen hingegen er- 

hält man homogene Listen und handhabbare Größen. 
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# DWDS-Wortprofil 


Wortprofil fiir Feindbild als Substantiv Frequenz:384 Relationenfilter 


Alle | PP | KOM | Attribut | Beiordnung | Subjekt (Passiv) | Akkusativobjekt | 
Dativobjekt | Infinitivobjekt | Genitivmodifizierer 


alten antibolschewistische falschen gemeinsame 


gepflegte ideale ideologische intaktes klares klassischen linke 
neues primitive richtiges schlichten westlichen äußere überkommene 


Wortart: Substantiv Zeige Tags Tabellenansicht 


Abb. 6: Filtern nach Relationstyp Attribut 


Ein wesentlicher Mehrwert des Wortprofils besteht darin, dass alle extrahier- 
ten Relationen stets mit den dazugehörigen Satzkontexten im Korpus ver- 
knüpft sind und somit einen Überblick über den Verwendungszeitraum und 
die semantischen und pragmatischen Kontexte ermöglichen, in denen die syn- 
taktische Relation verwendet wird. Klickt mal beispielsweise in Abbildung 5 
auf das erste Wort Abbau, welches zum Suchwort Feindbild in einer Attri- 
butrelation im Genitiv steht (Relation GMOD), gelangt man zu den insge- 
samt neun Kontexten, die vom Analysesystem Syncop aus dem Wortprofil- 
Korpus extrahiert wurden (Tabelle 1). Die Beispiele sind nummeriert und 
nach absteigendem Datum geordnet: der jüngste Beleg stammt aus dem Jahre 
2000, der älteste von 1982. Die möglichen Textsorten (Belletristik, Gebrauchs- 
text, Wissenschaft, Zeitung) sind in der dritten Spalte aufgeführt; diese ist mit 
einem Doppelpunkt von der Belegquelle getrennt. In der 4. Spalte findet sich 
der Kontext für die syntaktische Relation, wobei die gesuchten Wörter farblich 
hervorgehoben sind. 


1 2000-06-29 Zeitung: ZEIT Wir brauchen einen Abbau der 
Feindbilder von den „illegalen Einwanderern“, bei denen in der Regel Täter 
und Opfer verwechselt werden. 
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2 1998-04-23 Zeitung: ZEIT Wir brauchen einerseits einen 
Abbau des Feindbilds von den illegalen Einwanderern, bei denen ohnehin in 
der Regel Tater und Opfer verwechselt werden. 

3 1990-04-20 Zeitung: ZEIT Und was den Abbau der Feind- 
bilder betrifft, die ja schon vor 1945 von Deutschland gegen die Sowjetunion 
und von der UdSSR gegen Deutschland geschaffen wurden: 

4 1990-02-23 Zeitung: ZEIT Der Abbau der Feindbilder sollte 
den Sowjetbürgern eine europäische Identität und der Perestrojka westlichen 
Elan bringen. 

5 1989-05-26 Zeitung: ZEIT Er mahnte aber auch die Bun- 
desrepublik, in der Abrüstung nicht hinter der DDR zurückzubleiben (die ge- 
rade Truppen einseitig reduzierte) und wünschte sich einen Abbau des Feind- 
bildes auch in der Bundesrepublik. 

6 1989-05-05 Zeitung: ZEIT Bobowikows Beitrag ließ auch 
über die Wahlen hinaus unverblümt die ideologische Kriegserklärung gegen 
die Grundwerte der Perestrojka erkennen — gegen Glasnost im Inneren und 
gegen den Abbau der Feindbilder. 

1. 1988-10-21 Zeitung: ZEIT Sie verfolgt jedoch nicht mehr 
die Illusion des Ausspielens und Aufspaltens, weil sie das Ansehen und die In- 
tegration der Sowjetunion in die Weltgemeinschaft durch den Abbau der 
ideologischen Feindbilder fördern will. 


8 1988-09-30 Zeitung: ZEIT Mit dem Abbau der alten Feind- 
bilder tut sich die DDR offenbar schwer. 
9 1982-05-15 Zeitung: ADG Er fordere deshalb die Demon- 


stranten auf, auf beiden Seiten für einen Abbau der Feindbilder einzutreten, 
die Resignation gegenüber der weltweiten Aufrüstung abzuwehren und eine 
aktive gewaltfreie persönliche Haltung anzustreben. 

Tab. 1: Konkordanzansicht für Relation GMOD: Abbau, Feindbild 


Die Stärke des syntaktischen Ansatzes zeigt sich bei der Extraktion von syn- 
taktischen Funktionen. Hierfür reicht in der Regel nicht nur ein lokaler Kon- 
text, sondern der gesamte Satz muss ausgewertet werden, da Komplemente 
von Verben im allgemeinen Fall nicht mit lokalen Funktionen extrahiert wer- 
den können. Ein Beispiel hierfür liefert die Relation Verb-Präpositionalphrase 
auskommen ohne Feindbild. Diese Relation enthält alle Sätze im Korpus, bei de- 
nen das Verb auskommen — mit und ohne abtrennbarem Verbpartikel — in Re- 
lation mit der Präpositionalphrase ohne Feindbild steht. Durch Klick auf aus- 
kommen ohne in Abbildung 4 gelangt man zu den Satzkontexten in Tabelle 2, 
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bei denen die Konstruktion sowohl in Verbzweit- wie auch Verbletztstellung 
vorkommt. 
auskommen_ohne: 


1 1993-10-22 Zeitung: ZEIT Hamburg 1993; 206 S., 26, -DM 
fast ganz ohne dieses Feindbild auskommt: 
2 1991-09-26 Zeitung: ZEIT Hysterie und Haß. Doch die Un- 


fähigkeit des einstigen Freiheitshelden gegen Kreml und Kommunismus, der 
jetzt ohne Feindbilder nicht mehr auskommt, der über den Weltmarkt nichts, 
aber über die Weltverschwörung gegen Georgien alles weiß, hat Hysterie und 


Haß gesät. 

3 1989-10-20 Zeitung: ZEIT „Das Land kam vorübergehend 
ohne Feindbilder aus „, heißt es im Begleitbuch. 

4 1972-07-28 Zeitung: ZEIT Das kritische Denken des Auto- 


renteams kommt ohne Feindbild nicht aus. 
Tab. 2: Konkordanzansicht für Relation V-PP: auskommen, ohne Feindbild 


4.2. grau 

Im vorangegangen Abschnitt wurden die verschiedenen Nutzungsmöglichkei- 
ten des Wortprofils auf der Webplattform www.dwds.de erläutert. Noch nicht 
angeschnitten wurde die lexikographische Qualität des Wortprofils. Aufgrund 
des vom Korpus abgedeckten Zeitraums ist hierfür der Vergleich mit einem 
großen einsprachigen deutschen Gegenwartswörterbuch naheliegend. Für den 
Vergleich haben wir zwei große Wörterbücher herangezogen: das große Wör- 
terbuch der deutschen Sprache in 10 Bänden des Dudenverlags (GWDS) und 
das Wörterbuch der deutschen Gegenwartssprache (WDG). Da der Vergleich 
relativ ausführlich dargestellt werden soll, um die Bandbreite der möglichen 
Vergleichsparameter zu illustrieren, soll er an dieser Stelle nur für ein Wort 
demonstriert werden, nämlich für das Adjektiv grau. Dieses Adjektiv haben 
wir ausgewählt, weil es häufig genug für ein ausgeprägtes Wortprofil ist, weil 
es mehrere Lesarten hat und weil es keine grundsätzlichen Bedeutungsverän- 
derungen in den letzten Jahren erfahren hat. Aus urheberrechtlichen Gründen 
beziehen wir uns nur auf den Artikel des WDG (siehe Anhang), weisen aber 
an den entsprechenden Stellen auf die Unterschiede zum GWDS hin. In der 
Tat zeigt sind die Artikelbeschreibungen des Stichworts grau in beiden Wör- 
terbüchern in ihrer Bedeutungsstruktur im großen und ganzen vergleichbar, 
wenn auch nicht gleich. Einige wichtige Unterschiede zwischen beiden Wör- 
terbüchern lassen sich feststellen. Das GWDS hat die Lesarten 1 und 2 des 
WDG, bei der der konkrete und der bildliche Gebrauch beschrieben wird, zu 


einer zusammengefasst. Das GWDS führt im Gegenzug eine neue Lesart ein, 


Statistische Wortprofile zur schnellen Analyse der Syntagmatik in Textkorpora 


bei der grau im Sinne von „sich an der Grenze der Legalität bewegen“ (um- 
gangssprachlich) verwendet wird, wie beispielsweise in graue Händler. Darüber 
hinaus verzeichnet das GWDS einige geläufige syntaktische Relationen, die 
das WDG nicht aufführt, beispielsweise graue Schläfen, graues Brot oder grau 
meliert. Umgekehrt fallen auch einige Relationen weg, wie beispielsweise graue 
Theorie, graue Maus oder in Ehren ergraut. Vom Umfang her halten sich beide 
Wörterbücher die Waage. 

Der quantitative Vergleich der Wörterbücher mit dem Wortprofil zeigt zu- 
nächst einmal folgendes: das WDG verzeichnet 43 syntaktische Relationen, 
das GWDS nur 25 Relationen. Viele der Relationen im WDG sind jedoch 
„erwartbar“, wie beispielsweise Bart oder Haarsträhne, wenn man ohnehin 
Haar aufführt. Insofern bietet das WDG hier keinen Bedeutungsüberschuss 
gegenüber dem GWDS. Im DWDS-Wortprofil werden 7727 Relationen ex- 
trahiert, darunter 388 verschiedene Relationen (f>=4, sal>0). Dies ist mehr als 
das Zehnfache der im Wörterbuch aufgeführten Wortverbindungen. Es stellen 
sich somit die Fragen nach der gemeinsamen Schnittmenge von Wortprofil 
und WDG (markiert als (+ WP;+WDG)), nach denjenigen Kookurrenzen, die 
im Wortprofil, aber nicht im WDG sind (+WP;-WDG), und umgekehrt nach 
der Qualität derjenigen Wortverbindungen, die nicht im Wortprofil, dafür 
aber im WDG sind (-WP;+WDG). 


(+WP;+WDG) 

Zunächst einmal ergibt der Abgleich von Wortprofil und WDG, dass sich in 
der Schnittmenge folgende 29 Kookurrenzen mit grau befinden: 

Vorzeit, Maus, Haare, Alltag, Bart, Himmel, Star, Wolke, Mauer, Theorie, Alter- 
tum, Haarsträhnen, Uniform, Augen, Haupt, Kostüm, Gestein, alt, färben, Scheitel, 
Elend, Ode, Regenwolken, Wölkchen, Morgen, Meer, Gesicht, Haut, Strand 
Nimmt man noch Synonyme oder nahe Hyperonyme hinzu, so findet man 
auch weitere zwei WDG-Einträge im WP: Frühlicht (WP: Morgenlicht), Fer- 
ne (WP: Unendlichkeit) 


(+WP;-WDG) 

Uber 90% aller salienten syntaktischen Relationen, genauer 369 der 398 Rela- 
tionen des Wortprofils, sind nicht im WDG. Diese Zahl sagt zunächst nichts 
über die lexikalische Relevanz dieser Relationen aus. Bei unserem Vergleich ha- 
ben wir daher die Einträge auf ihre lexikalische Relevanz angesehen, wobei wir 
einen Unterscheidung zwischen hoch salient (sal>10), salient (sal>5) und 
schwach salient (sal<5) gemacht haben. 
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Hoch salient sind insgesamt 54 syntaktische Relationen, 10 davon im WDG; 
unter den verbleibenden finden sich folgende lexikographisch relevante Wort- 
verbindungen (geordnet nach absteigender Salienz): 


* graue Eminenz 

e graue Maus (fehlt im WDG im übertragenen Sinne) 

e grauer Kapitalmarkt 

e graue Schläfen 

e grauer Pfandbriefmarkt (im Sinne von: geschlossener Fonds) 
e Graue Ackerschnecke (limax agrestis) 

* graue Zellen 


Ferner fehlen folgende Eigennamen-Kontexte: 
e Graue Panther (politische Partei) 

e Graue Wolfe (extremistische politische Partei) 
* Graue Kloster (Gymnasium in Berlin) 


Salient (Sal>5) sind weitere 143 Wortverbindungen im Wortprofil; davon sind 
12 im WDG. Unter den verbleibenden 132 Relationen sind die lexikogra- 
phisch relevanten Wortverbindungen (geordnet nach absteigender Salienz): 


e graues Einerlei 

* graues Umweltpapier 

e graue Asche (von Toten oder von verbranntem Material) 

e graue Habenzinsen (auf dem nicht freien Kapitalmarkt) 

e grauer Markt 

e grauer Haarkranz 

* grauer Nadelstreifen 

e ferner alle Adjektiv-Modifizierer: beispielsweise 'schütter' wie in schüt- 
teres graues Haar, voll‘ wie in voll grauer Haare 


Schwach salient: unter den Wortverbindungen mit einer Salienz < 5 sind nur 
noch wenige lexikographisch interessante Verbindungen zu finden; u.a. graue 
Erbsen, graue Liste oder der Graue Burgunder. Die meisten sind transparent 
und erwartbar, wie beispielsweise graue Krawatte, graue Socke oder graue Matte. 


(-WP;+WDG) 
Umgekehrt finden sich 14 Wortverbindungen im WDG, die nicht im Wort- 
profil auftauchen: 
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Frühlicht, Stoff, wie eine Maus, bei Nacht sind alle Katzen grau, keine grauen 
Haare wachsen lassen, in Ehren grau geworden, Gesichtsfarbe, Woche, Tag, Monat, 
Mittelalter, vor grauen Jahren, Ferne, Zukunft 

Diese Zahl scheint auf den ersten Blick recht hoch, relativiert sich aber schnell, 
wenn man sie anhand ihrer Gebräuchlichkeit analysiert und mit den Alternativen 
vergleicht, die das Wortprofil für einige dieser Wortverbindungen bereitstellt. In 
der Folge soll dies anhand der Lesarten des WDG detaillierter gezeigt werden. 


WP und WDG im Lesartenvergleich 
Das WDG unterscheidet insgesamt fünf Lesarten von grau. 


Lesart 1: /Mischfarbe aus Schwarz und Weiß/ 

(+WP;+WDG): Auge, Gestein, Haut, Himmel, Kostüm, Mauer, Maus, Meer, Re- 
genwolke, Strand, Uniform, Wolke 

(+WP;-WDG): unter anderem Granit, Beton, Anzug, Kittel, Kutte 
(-WP;+WDG): Stoff: Dafür sind im Gegenzug im WP einige Synonyme, wie 
Flanell, Samt oder Wolle. Die Vergleichskonjunktion grau wie eine Maus findet 
sich nur im WDG (auch nicht im GWDS); im Gegenzug ist aber im WP das 
wesentlich häufiger gebrauchte graue Maus enthalten, mit beispielsweise fol- 
gendem Beleg: Arminia Bielefeld hat schon seit ein paar Jahren den Ruf als „graue 
Maus“ der Liga weg. Die ZEIT, 26.12.2008 


Lesart 2a: /farblos, bleich, durch zunehmendes Alter/ 

(+WP;+WDG): Bart, Haar, Haarsträhne, Haupt, Scheitel, Star, alt 
(+WP;-WDG): u.a. Schläfen, Strähne, Haarkranz 

(-WP;+WDG): 

sich keine grauen Haare wachsen lassen (bildlich, umgangssprachlich im Sinne 
von sich keine Sorgen machen); wird als Konstruktionsmuster vom Wortprofil 
derzeit nicht extrahiert, ist aber unter den Beispielen von ,grau Haar“ mehr- 
fach zu finden. 

in Ehren grau geworden: taucht in den Korpora insgesamt 4 Mal auf, ist aber 
im Wortprofil nicht salient; aber dafür gibt es über 100 Treffer im Korpus für 
"in Ehren ergraut". Diese sind unter dem Wortprofil von „Ehre“ zu finden. 


Lesart 2b: /farblos, bleich, durch Blutleere/ 
(+WP;+WDG): Gesicht 

(+WP;-WDG): keine Einträge 
(-WP;+WDG): 
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graue Gesichtsfarbe: ist im WP nicht enthalten, da es bereits im zugrundelie- 
genden Korpus mit insgesamt nur drei Belegen unter dem derzeit gewahlten 
Salienzschwellwert von 4 liegt. 

vor Haf (kommt im WDG nur als Literaturbeleg vor (Marchwitza)). In der 
Korpora gibt es diesen Beleg gar nicht. Auch im Web findet man hierfùr nur 
einen Treffer? — und dieser stammt noch dazu aus dem WDG: ,, Sie starrte 
mich grau vor Haß an“ (Marchwitza Jugend 248) 


Lesart 3: /übertragen/, trostlos und öde 

(+WP;+WDG): Alltag, Elend, Elend, Morgen, Theorie, öde 

Letztere Konstruktion ist im WDG nur durch das Goethezitat belegt: grau, 
treuer Freund, ist alle Theorie . Im Wortprofil finden sich dazu 140 Belege mit 
anderen Konstruktionen, die illustrieren, dass „graue Theorie“ nicht nur im 
Zusammenhang mit dem Goethe-Zitat gebraucht wird, z.B. 


° Das Ethos ist kein Istzustand, es ist ein Sollzustand, trotzdem nicht 
graue Theorie, sondern eine sehr praktische Sache. (ZEIT, 04.01.2010) 

. Und jede Eröffnungsvorbereitung graue Theorie sein lässt. (ZEIT, 
28.8.2009) 

. Dass dies keine graue Theorie ist, zeigt ein Fall in den USA. (ZEIT, 
18.5.2009) 

. Alles graue Theorie, die uns Winzer in die Illegalitàt treibt. (ZETT 21.11.2008) 

e Doch wie sich zeigte, blieb das graue Theorie. (ZEIT, 27.8.2008) 

. Die Betriebshandelsspanne erweist sich, nämlich, als graue Theorie. 
(ZEIT, 24.7.2008) 


(+WP;-WDG): keine Einträge 

(-WP;+WDG): Monat, Tag und Woche. Alle drei Begriffe entstammen einem 
Literaturbeleg von Feuchtwanger (s. Anhang). Diese Kookurrenzen sind nicht 
salient, dafür sind aber nahe Synonyme im Wortprofil: Herbsttag, Nachmittag, 
Novembertag oder Vormittag. 

das graue Elend kriegen (sich tief unglücklich fühlen, zeigen) ist nicht im Wort- 
profil, dafür aber die einfachere Attribut-Nomen-Relation graues Elend. 


Lesart 4: /weit zurückliegend längst vergangen/ 
(+WP;+WDG): Altertum, Vorzeit 
(-WP;+WDG): Mittelalter 


2 Suchanfrage unter www.google.de vom 6.12.2010 
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Lesart 5: /unbestimmt, ungewiss/ 

(+WP;+WDG): keine Relationen sind im Schnitt 

(-WP;+WDG): graue Ferne, Zukunft, diese sind beide nicht im Wortprofil sa- 
lient. 


Zusammengefasst noch einmal die wichtigsten Schlüsse, die sich aus dem Bei- 
spiel grau ableiten lassen. Wortprofile können im Vergleich zu großen einspra- 
chigen Wörterbüchern ein Vielfaches der syntaktischen Relationen zu einem 
Wort enthalten. So verzeichnet das Wortprofil zu grau knapp 400 verschiede- 
ne Relationen, wohingegen das WDG 43, das GWDS nur 25 Wortverbin- 
dungen aufführen. Dies schlägt sich im auch direkten Vergleich nieder: mit ei- 
ner hohen Salienz (sal>5) enthält das Wortprofil mehr als 20 lexikographisch 
relevante Beispiele, die nicht im WDG verzeichnet sind. Bei einer Salienz von 
unter 5 im Wortprofil nimmt die Dichte der lexikographisch relevanten Rela- 
tionen stark ab. Von den knapp 200 syntaktischen Relationen (s<5) sind nicht 
mehr als 5 als lexikographisch relevant einzustufen. Erstaunlich ist zunächst, 
dass das Wortprofil nur etwa 70% der im Wörterbuch verzeichneten Wortver- 
bindungen als syntaktische Relation enthält. Zu den meisten dieser fehlenden 
Verbindungen führt das Wortprofil jedoch gebräuchlichere Alternativen auf; 
in anderen Fällen existiert die Wortverbindung nur als Literaturzitat. Man fin- 
det im Wortprofil auch eine zusätzliche Lesart, die zwar nicht im WDG, je- 
doch im GWDS verzeichnet ist. Das Wortprofil hat aber hier die gebräuchli- 
cheren Beispiele: grauer Kapitalmarkt oder grauer Markt (WP) statt graue 
Händler oder graues Material (GWDS). Schließlich, das zeigt das Beispiel 
graue Theorie, findet man mit dem Wortprofil zahlreiche authentische Kontex- 
te und Verwendungen, die von dem einzigen dazu im WDG aufgeführten 
Goethezitat (grau, mein Freund, ist alle Theorie) abweichen. Eine Konstruktion 
übrigens, die in das GWDS nicht mehr aufgenommen wurde. 


5. Potentiale des Wortprofils 

Das Beispiel grau in Abschnitt 4.2 macht deutlich, dass in dem gegenwärtigen 
DWDS-Wortprofil mit einem zugrundeliegenden Korpus der Größe von 500 
Millionen Textwortern eine große Reichhaltigkeit von Wortverbindungen 
steckt, die es auch im Vergleich mit großen einsprachigen Wörterbüchern in- 
teressant macht. Bevor wir zum Abschluss dieses Beitrags kurz auf die Poten- 
ziale dieses Ansatzes eingehen, sollen zuvor noch ein paar einschränkende An- 
merkungen zur Reichweite der in 4.2 gemachten Beobachtungen gemacht 
werden. 
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Erstens wird es notwendig sein, diese Befunde auf der Basis aller offenen 
Wortarten anhand einer hinreichend großen Anzahl von Wörtern zu replizie- 
ren. Eine entsprechende Studie, die einen Vergleich von 50 Wortprofilen mit 
entsprechenden Einträgen in WDG-Artikeln ähnlich dem in Abschnitt 4.2 
durchführt, ist derzeit im Gange. Dabei zeigt sich, und das ist die zweite Rela- 
tivierung, dass die Abdeckung der Relationsextraktion mit dem Parser Syncop 
für den Verbbereich im Allgemeinen weitaus geringer ist als für den nominalen 
und den adjektivischen Bereich. Dies ist deshalb unmittelbar einleuchtend, da 
viele syntaktische Relationstypen von Nomina und Adjektiven mit lokalen Ab- 
hängigkeiten zu erfassen sind, wohingegen bei den Verben syntaktische Funk- 
tionen, also phrasenübergreifende Abhängigkeiten zu extrahieren sind. 

Die dritte Relativierung schließlich betrifft die Evaluierung der Qualität der 
extrahierten Relationen in Bezug auf deren Status als Kollokation. Hierzu lässt 
sich folgendes feststellen: Syntaktische Relationen weisen, wenn sie statistisch 
signifikant sind, eine Ähnlichkeit zu dem weit verbreiteten Kollokationsbegriff 
von Hausmann (1984) auf, weichen aber in zwei Aspekten entscheidend da- 
von ab. Kollokationen im Hausmannschen Sinne bestehen aus einer Kolloka- 
tionsbasis und einem Kollokator. Beispiele hierfür sind schützeres Haar, Ter- 
min einhalten oder hoch erfreut (die Basis ist hier fettgedruckt, der Kollokator 
kursiv). Syntaktische Relationstypen hingegen sind symmetrisch, d.h. wenn 
das Wort A in Relation mit dem Wort B steht, so steht auch umgekehrt B in 
Relation mit A. Der Grund hierfür ist ein pragmatischer, da bei automatisch 
extrahierten syntaktischen Relationen Basis und Kollokator nicht sicher be- 
stimmt werden können und man somit die Abdeckung des Wortprofil-Ansat- 
zes für den Nutzer erhöht, wenn man die Umkehrbarkeit der Relation und so- 
mit den Zugriff auf die Kollokation sowohl über die Basis als auch den 
Kollokator zulässt. Ganz abgesehen davon ist es bei einer Datenbankrepräsen- 
tation immer möglich, die Kollokation sowohl unter der Basis als auch unter 
dem Kollokator unterzubringen. Darüber hinaus sind bei Kollokationen im 
Hausmannschen Sinne die Menge der Kollokatoren für eine gegebene Basis 
sehr eingeschränkt. Vor allem geht es darum, „nicht erwartbare“ Kollokatoren 
zu beschreiben. In einem völlig automatisierten System ist dies nicht möglich. 
Hier lassen sich für ein gegebenes Wort die syntaktisch relevanten Kookur- 
renzpartner nur über die statistische Signifikanz ermitteln. Diese aber ist im 
allgemeinen nicht gleichbedeutend mit einer Erwartbarkeit. Beispielsweise 
führt das DWDS-Wortprofil für das o.g. Nomen Haar 223 Adjektive auf, die 
allesamt statistisch signifikant in Bezug auf das Suchwort sind. Darunter gibt 
es eine ganze Reihe von „echten“, weil nicht erwartbaren Kollokationen, wie 
beispielsweise schütter, gegelt oder gescheitelt, aber auch andere erwartbare signi- 
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fikante Kollokate wie schwarz, blond, lang oder nass. Obzwar diese Kookurren- 
zen keine Kollokationen im Hausmannschen Sinne sind, so sind viele davon 
auch nicht beliebig, sondern semantisch oder pragmatisch motiviert. Beispiele 
hierfür wären für Ball beispielsweise Ball abspielen, Ball zuwerfen, oder Recht 
anwenden, Recht brechen, Recht auf Mitbestimmung für Recht. 

Jenseits dieser drei Einschränkungen sind jedoch die Potenziale künftiger Ent- 
wicklungen von statistischen Wortprofilen enorm. Die Erweiterungen liegen 
zunächst in der Verbesserung der Abdeckung der Parser zur Extraktion der 
syntaktischen Relationen, vor allem aber in der Erweiterung und Vergröße- 
rung der Korpusbasis. Wie bereits weiter oben erwähnt, lassen sich mit größe- 
ren, nach Textsorten breit gestreuten Korpora sinnvolle Wortprofile für weit- 
aus mehr Stichwörter bilden und die Konfidenz der Salienz syntaktischer 
Relationen verbessern. 

Darüber hinaus sind Wortprofile als Ressource für die Textproduktion von gro- 
ßen Wert. Mit statistischen Wortprofilen lassen sich sowohl typische Wortver- 
bindungen für ein Wort auffinden als auch deren semantische und pragmati- 
sche Kontexte in authentischen Textzusammenhängen mit wenigen Mausklicks 
nachschlagen. Hierzu noch einmal ein Beispiel: Im GWDS beispielsweise fin- 
det man, wenn man unter dem Stichwort grau die Relation grau meliert nach- 
schlägt, einen authentischen Textbeleg: 

grau melierte Schläfen; sein Haar war inzwischen g. meliert, was seine Er- 
scheinung noch würdevoller machte (Danella, Hotel 30) (GWDS, Eintrag 
grau, Lesart 1) 

Das Beispiel deutet an, dass sich die Relation grau meliert in der Regel auf eine 
Person bzw. dessen Haar bezieht. Die Schlussfolgerung darüber, ob sich dies 
nur auf eine männliche Person bezieht oder ob Träger desselben positiv kon- 
notiert wird, bleibt jedoch der Intuition des Nutzers überlassen. Mit dem 
Wortprofil lässt sich diese Vermutung mit einem Klick an nicht nur einem, 
sondern vielen weiteren authentischen Korpusbeispielen überprüfen. So findet 
man im DWDS-Wortprofil die Verbindung grau meliert mit einer Salienz von 
38 und einer Frequenz von 51, die sich ausschließlich auf männliche Personen 
beziehen. Darüber hinaus belegen zahlreiche dieser Kontexte die positiven 
Konnotationen, die entweder auf den sozialen Status des Trägers oder andere 
pragmatische Kontexte zurückzuführen sind. Jeweils ein Beispiel hierzu: 
Eduardo Montes ist ein stolzer Mann. Grau meliertes Haar, hellblaues Maß- 
hemd, fein gepunktete Krawatte — fast zu elegant für sein profanes Chefzim- 
mer in der Hofmannstraße. (ZEIT, 04.10.2006) 
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Oder dass man gute Kunden zum Essen in einen der sechs Speisesäle einlädt, 
wo grau melierte Kellner auf Kosten des Hauses schon mal einen Grand Cru 
entkorken. (ZEIT, 31.10.2001) 

Künftige Experimente mit anderen und größeren Korpora werden zeigen, in- 
wieweit Werkzeuge dieser Art ebenso natürlich für das Verfassen von Texten 
sein werden, wie heutzutage bereits die Rechtschreib- und Grammatikkont- 
rolle oder die Synonymvorschläge in Textverarbeitungen. 
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Anhang 

Wörterbuchartikel grau im WDG 

grau /Adj./ 1. /Mischfarbe aus Schwarz und Weiß/ die g. Haut des Elefanten; g. wie eine 
Maus; ein g. Stoff, Kostüm; eine g. Uniform; er hat g. Augen; g. Gestein; g. Mauern; 
Am grauen Strand, am grauen Meer /Und seitab liegt die Stadt Storm 8,194; g. 
Rauch-, Regenwolken; der Himmel ist ganz g.; g. Frühlicht; Grau ist“ immer, wenn 
ein Morgen naht BRECHT Gedichte 278; /sprichw./ bei Nacht sind alle Katzen g. (nachts 
erkennt man keine äußerlichen Unterschiede) ein helles, dunkles, düsteres, bleiches, kaltes, 
fahles, farbloses Grau; das Grau der Regenwolken; das Blau des Himmels ging in Weiß 
und Grau über; eine Bluse in Grau; die Dame in Grau; sie kam in Grau, bevorzugt die 
Farbe Grau; vg/. Grauchen 2. farblos, bleich a) durch zunehmendes Alter: g. Haar; eine g. 
Haarsträhne; Sie hatte bereits einen grauen Scheitel G. Hauprm. 4,552; ein g. Bart; 
Achtung vor einem g. Haupte (einem alten Menschen) haben sein g. Haar färben; alt und 
g. werden; er ist in Erhren g. geworden; der g. Star (krankhafte Trübung der Linse im 
Auge) /bildl./ um g . darüber, deshalb brauchst du dir keine g. Haare wachsen zu lassen 
(darüber brauchst du dir keine Sorgen zu machen) b) durch Blutleere: ein g. Gesicht, mein 
mageres graues Gesicht und die Trostlosigkeit meines Blickes BOLL Wort 12; eine g. 
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Gesichtsfarbe; Der alte Mann wurde ganz grau im Gesicht BRECHT Dreigroschenroman 
296; Sie starrte mich grau vor Haß an MarcHWITZA Jugend 248 3. /übertr./ trostlos, 
triibe, öde: Es hieß warten, einen grauen Morgen und einen grauen Tag und eine graue 
Woche und einen grauen Monat FeucHTwW. Tag 78; In Dresden ging der graue Alltag 
wieder los RENN Kindheit 23, Grau, teurer Freund, ist alle Theorie GoETHE Faust I 
2038; ihr erschien die Welt g. und öde; umg. scherzh. das g. Elend kriegen (sich 
tief unglücklich fühlen, zeigen)® ich kann das Grau in Grau unserer Nachkriegsepoche 
auf die Dauer nicht aushalten G. Hauprm. Sonnenuntergang I 4. weit zurückliegend, 
längst vergangen: in g. Vorzeit; im g. Altertum, Mittelalter; vor g. Jahren, Zeiten; 5. un- 
bestimmt, ungewiß: das liegt noch in g. Ferne, Zukunft; 


Quelle: WDG - elektronische Version, www.dwds.de 


Semantische Nahe als Ahnlichkeit von 
Kookkurrenzprofilen’ 


Cyril Belica - Institut für Deutsche Sprache Mannheim 


Abstract 

Dieser Beitrag betrachtet lexikalisch-semantische Relationen aus einer emergen- 
tistischen Perspektive vor dem Hintergrund eines korpusgeleiteten empirisch-lin- 
guistischen Ansatzes. Er skizziert, wie eine systematische Erfassung und Auswer- 
tung des Kookkurrenzverhaltens? von Lexemen — die Analyse der Ahnlichkeit von 
Kookkurrenzprofilen mit Hilfe von selbstorganisierenden lexikalischen Merk- 
malskarten und ihre im Diskurs verankerte Interpretation — wichtige Einblicke in 
die Struktur verschiedenartiger Verwendungsaspekte dieser Lexeme einschließlich 
ihrer semantischen Nähe ermöglichen. Die vorgestellte Methodik wird dabei — 
über die explorativ-analytischen Zielsetzungen hinaus — als eine abduktive, auf 
Theoriebildung zielende Generalisierungsstrategie im postulierten Lexikon-Syn- 
tax-Kontinuum verstanden. Zum Schluss werden die Anwendungsmöglichkeiten 


einiger Komponenten dieser Methodik in der Lexikografie, Lexikologie und Di- 
daktik diskutiert. 


1. Das Deutsche Referenzkorpus 

In Anlehnung an den Auftrag des IDS, „[...] die deutsche Sprache in ihrem 
gegenwärtigen Gebrauch zu dokumentieren und zu erforschen [...]“, hat der 
Aufbau von elektronischen Korpora am Institut eine lange Tradition. Der in 
den 60er Jahren des zwanzigsten Jahrhunderts noch neue Gedanke, Analyse 
und Beschreibung der deutschen Sprache auf computergespeicherte Textkor- 
pora zu stützen, wurde von den Gründungsdirektoren des IDS Paul Grebe 
und Ulrich Engel in die Tat umgesetzt: Im Jahr 1964 begannen die konzep- 


1 Dieser Beitrag bietet einen Rückblick auf die Forschungsarbeit des Programmbereichs Korpuslinguistik 
am Institut für Deutsche Sprache (IDS) in Mannheim in den letzten Jahren mit einem besonderen Fokus 
auf die Hypothese der emergenten Natur lexikalisch-semantischer Relationen. Er ist durch eine stilistische 
Bearbeitung des Transkripts eines am 28. März 2008 in Brixen gehaltenen Vortrags entstanden und bewahrt 
dessen kursorischen Charakter. Er stellt die Ergebnisse gemeinsamer Arbeit des Autors mit Holger Keibel, 
Marc Kupietz und Rainer Perkuhn und der Kooperation mit Marie Vachkovä vor, denen der Autor auch für 
die Durchsicht und viele Verbesserungen des Manuskripts herzlich dankt. 


2 Wegen der klassifikatorischen Vorbelastung des Terminus Kollokation in der deutschsprachigen Fachliteratur 
wird am IDS der Bezeichnung Kookkurrenz insbesondere dann der Vorzug gegeben, wenn es darum geht, die 
theorieneutrale, prä-interpretative Perspektive auf die im lokalen lexikalischen Kontext empirischen Sprach- 
materials objektiv beobachtbaren (d.h. messbaren) Kohäsionsstrukturen hervorzuheben. 
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tuellen Arbeiten und die Texterfassung (damals noch auf Lochkarten und 
-streifen) des Mannheimer Korpus 1. 

Heute gehört das DEUTSCHE REFERENZKORPUS des IDS mit seinen ca. 3,4 
Milliarden laufenden Textwörtern (Stand: November 2008) weltweit zu den 
größten und wichtigsten sprachwissenschaftlich motivierten Sammlungen 
des geschriebenen Deutsch. Es wird im Hinblick auf Größe, Stratifikation, 
extratextuelle Dokumentation und urheberrechtliche Unbedenklichkeit fort- 
laufend weiterentwickelt. Wegen der restriktiven Rechtslage ist DEREKo 
kein offenes Korpusarchiv. Das IDS erwirbt das nicht übertragbare und 
durch weitere Auflagen eingeschränkte Nutzungsrecht an DEREKo-Textma- 
terial durch Lizenzverträge mit den (derzeit mehr als 170 einzelnen) Textge- 
bern und räumt seinerseits den DEREKo-Endbenutzern das Recht zur wis- 
senschaftlichen, nichtkommerziellen Nutzung von DEREKo durch 
individuelle Nutzungsvereinbarungen ein, wie Kupietz und Keibel (2009a) 
berichten. Sie setzen fort: 


To retain its long-time outstanding reputation as a trustworthy partner of text donors in Germany 
and abroad, the IDS maintains the highest standards of ethical and meticulous legal conduct per- 
taining to the DEREKo use and encourages and expects its employees to report any suspected vio- 


lations of the end user licence agreement. 


Vor dem Hintergrund kritischer Uberlegungen zum wissenschaftstheoreti- 
schen Status empirischen Materials in der linguistischen Forschung (vgl. 
Keibel / Kupietz, 2009) wird DEREKo seit Anfang der 1990er Jahre nicht als 
ein „ausgewogenes“ oder gar „repräsentatives“ Korpus, sondern als eine mög- 
lichst umfassende Ur-Stichprobe (primordial sample) des öffentlichen Schrift- 
sprachgebrauchs konzipiert. Die Komposition von geeigneten auf der DE- 
ReKo-Ur-Stichprobe basierenden virtuellen Korpora ist bei dieser Strategie 
aus der Phase des Korpusaufbaus herausgelöst und bleibt — unter Einbezieh- 
ung der spezifischen Zusammenhänge der konkreten linguistischen Frage- 
stellung und ihrer Implikationen bezüglich der Adäquatheit der zugrunde- 
zulegenden Grundgesamtheit — den späteren Korpusnutzungsphasen 
vorbehalten. So wurde zum Beispiel das der aktuellen Version der Kookkur- 
renzdatenbank CCDB (s. Abschnitt 4.1) zugrundeliegende virtuelle Korpus 
ccdb-2007 u.a. durch eine per Zufallsziehung vorgenommene quantitative 
Dämpfung der thematischen Komponenten „Politik“ und „Sport“ aus DE- 
ReKo abgeleitet. 
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2. Der theoretische Rahmen 

Die prinzipielle Nützlichkeit von Sprachkorpora in der linguistischen For- 
schung und in den benachbarten Anwendungsgebieten ist heutzutage weitest- 
gehend unumstritten. Allerdings wird die Rolle des empirischen Materials in 
Abhängigkeit von der jeweiligen Zielsetzung, dem gewählten theoretischen 
Standpunkt, von verschiedenen praxisbezogenen Faktoren und nicht zuletzt 
vom aufgebrachten Maß an wissenschaftsmethodischer Strenge sehr unter- 
schiedlich verstanden. Der „dokumentarisch-unterstützende“ und der „Vermu- 
tungen überprüfende“ Beweggrund sind wohl die zwei vorherrschenden Moti- 
vationen eines typischen DEREKo-Nutzers. Im sprachtheoretischen Kontext 
wird das Korpus darüber hinaus oft nur als ein — aus der Perspektive einer frei 
wählbaren Systematik — möglichst erschöpfend zu beschreibender Datenkörper 
gesehen. 

Will man jedoch einen korpusgeleiteten empirisch-linguistischen Ansatz kon- 
zipieren, der explanatorische Theoriebildung zum Ziel hat, so ist es ratsam, zu- 
nächst das einzusetzende Gerüst von Annahmen und Lösungsstrategien dar- 
auf zu hinterfragen, ob es mit dem epistemischen Status des 
Forschungsgegenstandes (d.h. der Sprache) überhaupt vereinbar ist. In ihrer 
Betrachtung eines genuin korpuslinguistischen Forschungsprogramms, in des- 
sen Kontext auch die im vorliegenden Aufsatz beschriebenen Arbeiten ent- 
standen sind, stellen Kupietz und Keibel (2009b) ihre Auffassung der weit ver- 
breiteten — obgleich ungesicherten — Annahmen und Lösungsstrategien der 
linguistischen Theoriebildung folgendermaßen dar: 


Vermeiden sollte man zunächst vor allem die folgenden Credos der theoretischen Linguistik — 
nicht weil sie erwiesenermaßen falsch wären, sondern eher, weil nicht erwiesen ist, dass sie zutref- 
fen: erstens die Annahme, dass Sprache als formales System adäquat fassbar ist; zweitens die An- 
nahme, dass Dekomposition uneingeschränkt als Explanationsprinzip anwendbar ist; drittens, eine 
vollständige Theorie als Forschungsziel anzustreben; und viertens, die sprachliche Kompetenz 


zum Gegenstand der Forschung zu machen. 


Sie diskutieren unter anderem, wie man bei dem Versuch, die „breite Kluft 
zwischen der angestrebten theoretischen Beschreibungsebene einerseits und 
der phänomenologisch zugänglichen Ebene des Sprachgebrauchs andererseits“ 
zu schließen, überhaupt zu hinreichend abgesicherten Erkenntnissen für eine 
explanatorische Theoriebildung kommen kann und betonen in diesem Zu- 
sammenhang „die Notwendigkeit, sich dem Untersuchungsgegenstand Spra- 
che mit möglichst wenigen Vorannahmen über diesen Gegenstand selbst zu 
nähern“. Im Rahmen eines derart konzipierten Forschungsprogramms wird 
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das Phänomen Sprache aus einer emergentistischen Perspektive ausgeleuchtet, 
der zufolge „alles Regelhafte und Konventionelle in der Sprache ein Epiphä- 
nomen des Sprachgebrauchs ist und von den Sprachteilnehmern fortlaufend 
ausgehandelt wird“. Dieses ontologische Prinzip — so die Grundhypothese — 
durchdringt die Sprache auf allen ihren Ebenen und ist z.B. an der Konventio- 
nalisierung syntaktischer Strukturen und an der — besonders im Hinblick auf 
das Hauptthema dieses Beitrags relevanten — Entstehung und Festigung de- 
notativer und konnotativer Aspekte lexikalisch-semantischer Relationen kon- 
stitutiv beteiligt. Seine Wirkung — so die psychologische Arbeitshypothese, die 
hier nur angedeutet werden soll — manifestiert sich in der Interaktion von zwei 
miteinander verschränkten kognitiven Mechanismen’: 

e Im spontan-assoziativen Kontext nimmt der sehr weit gefasste Begriff 
der Ähnlichkeit eine Schlüsselrolle ein. Unsere Fähigkeit, im Alltag auch 
sehr unkonkrete, verschwommene Ähnlichkeiten unwillkürlich und 
schnell zu erkennen — besser gesagt, unsere Unfähigkeit, das permanente 
unwillkürliche Erkennen von Ähnlichkeiten außer Kraft zu setzen — ist 
lebensnotwendig, da Situationen und Kontexte, in denen wir uns bemü- 
hen, uns zurechtzufinden, nie vollkommen identisch sind. Ohne die 
spontane Sensibilität für Ähnlichkeiten wären frühere Erfahrungen für 
zukünftiges Verhalten nicht ohne analytisches, schlussfolgerndes Denken 
nutzbar, sie wären nicht assoziativ generalisierbar. Das gilt insbesondere 
auch für sprachliche Generalisierungen. 


e Im symbolisch-klassifikatorischen Kontext werden gezielt regelhafte Zu- 
sammenhänge in der individuellen Erfahrungswelt aufgespürt, typischer- 
weise in Form von abstrakten A-posteriori-Generalisierungen. Im Be- 
reich der Sprache manifestieren sich solche ordnenden Mechanismen 
schon in der Fähigkeit von Sprachteilnehmern, auf der Basis ihrer 
Spracherfahrung Ad-hoc-Hypothesen über grammatische Regelhaftig- 
keiten zu formulieren. Bei Ontogenese, Phylogenese und bei jedem ein- 
zelnen Sprachverarbeitungsakt eilen die spontan-assoziativen kognitiven 
Strategien des „Sich-Zurechtfindens“ den symbolisch-klassifikatorischen 
generell zeitlich voraus. 


Eine dementsprechend zentrale Rolle kommt in dem hier vorgestellten me- 
thodologischen Ansatz dem Begriff der Ähnlichkeit — „als einem graduellen 
Gegenkonzept zur Identität“ — zu (Kupietz / Keibel 2009b: 44). Es wird ange- 
nommen, dass man — von normativen bzw. terminologischen Zusammenhän- 
gen abgesehen — den vermöge gradueller Ähnlichkeit zwischen Situationen 


3 Vgl. die Annahme ,[...] human language faculty is instantiated in the mind as an equilibrium between two 
interdependent general cognitive agencies [...]” bei Vachkova / Belica (2009). 
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und Kontexten entstandenen unscharfen Konzeptualisierungen von sprachli- 
chen Phänomenen zwar mit Hilfe von A-posteriori-Klassifikationen eine 
Pseudo-Identitàt verleihen kann (um sie symbolisch referenzierbar zu ma- 
chen), dass aber diesen Explikationen immer eine Verzerrung innewohnt, z.B. 
in Form von Vereinfachung oder Überzeichnung.* 

Wenn aber Regelhaftes und Konventionelles wie angenommen im Sprachge- 
brauch (und gemessen am Erfolg der Kommunikation) ausgehandelt wird, 
dann ist es auch plausibel anzunehmen, dass die im Diskurs fortlaufend statt- 
findenden Aushandlungsprozesse konkrete Spuren in Sprachkorpora — d.h. in 
den Aufzeichnungen von Kommunikationsprozessen im Allgemeinen — hin- 
terlassen, welche mit geeigneten strukturentdeckenden Methoden zu ihren 
Entstehungsbedingungen zurückverfolgt werden können. Im Hinblick auf die 
hier diskutierten lexikalisch-semantischen Relationen bedeutet es, dass man 
die Rekonstruktion dieser Aushandlungsprozesse mit einer „Spurensuche“ in 
zwei verschiedenen „Strata“ gleichzeitig vorantreiben sollte: in den /okalen le- 
xikalischen Kontexten, in denen die einzelnen lexikalischen Einheiten ge- 
braucht wurden einerseits, und in den g/obalen, situativen Kontexten, in denen 
jene Aushandlungsprozesse jeweils stattgefunden haben andererseits. Da die 
zu betrachtenden — lokalen und globalen — Kontexte untereinander im Allge- 
meinen nie vollkommen identisch sind (s.o.), wird man, um die Überprüfung 
ihrer Zugehörigkeit zu einem bestimmten Aushandlungsakt und somit um ei- 
nen Hinweis für ihre fallbezogene Relevanz bestrebt, die Explikation ihrer 
Identität möglichst meiden bzw. hinauszögern und stattdessen wie oben dar- 
gelegt mit dem graduellen Konzept der Ähnlichkeit arbeiten müssen. 

Im Folgenden wird gezeigt, wie man diese allgemeinen Überlegungen im Ein- 
zelnen mit Hilfe einer großen Anzahl von Kookkurrenzprofilen, die auf Kook- 
kurrenzanalysen höherer Ordnungen basieren, und unter Anwendung des 
Funktionsprinzips von selbstorganisierenden Karten (Kohonen 1990), einer 
Art von künstlichen neuronalen Netzen, schrittweise operationalisieren und zu 
lexikalischen Merkmalskarten (Lexical Feature Maps) gelangen kann, die u.a. 
wertvolle Einsichten in die semantische Struktur lexikalischer Einheiten bie- 
ten. Ein wesentlicher Unterschied dieser Herangehensweise zu anderen, über- 
wiegend auf information retrieval ausgerichteten Ansätzen, wie etwa der Latent 
Semantic Analysis (LSA, s. zum Beispiel Deerwester et al. 1990), besteht darin, 
dass hier die den multidimensionalen semantischen Raum definierenden Ein- 
heiten ihrerseits durch komplexe Kookkurrenzstrukturen definiert sind, in de- 
nen die in den /okalen Kontexten auftretenden Regularitäten und Fluktuatio- 


4 Selbstverstindlich sind derartige Explikationen ungeachtet aller damit verbundenen Schwierigkeiten oft 
unentbehrlich und sinnvoll. 
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nen detaillierter festgehalten werden können als bei der dokument-orientierten 
Verfahrensweise. Der zweite wichtige Unterschied liegt in der postulierten 
psychologischen Verankerung dieser Kookkurrenzstrukturen begründet, eine 
Annahme, die insbesondere bei der Auseinandersetzung mit syntagmatischen 
Mustern (s. Abschnitt 3.1) als recht naheliegend erscheint: Auf diese Art defi- 
nierte syntagmatische Muster weisen eine derart hohe Rekurrenzrate in den 
uns vorliegenden Aufzeichnungen der Kommunikationsprozesse auf, dass es — 
wenn man einmal das Konzept der graduellen Ähnlichkeit als das konstituie- 
rende Prinzip von sprachlichen Generalisierungen akzeptiert hat (s. oben im 
Abschnitt zu spontan-assoziativen kognitiven Mechanismen) — geradezu un- 
verantwortlich erscheint ohne einen triftigen Grund die Vermutung zu ver- 
werfen, dass sie von individuellen Sprachteilnehmern — und dennoch intersub- 
jektiv — mitunter als sprachliche Gestalt wahrgenommen und bei 
Sprachproduktion und -rezeption auch als Ganzes verarbeitet werden. Sie 
können also insofern als psychologisch reale Objekte betrachtet werden, als sie 
möglicherweise beim Sprachverstehen nicht zwingend immer dekomponiert 
werden, wiewohl sie im Sinne traditioneller sprachsystemischer Kategorien 
dekomponierbar sind (und analog bei der Sprachproduktion). Nähere Auf- 
schlüsse dazu und eine auf experimentelle Daten gestützte Argumentation 
werden von den geplanten interdisziplinären Untersuchungen im Schnitt- 
punkt von Korpuslinguistik, Psycholinguistik und kognitiver Psychologie er- 
wartet. 


3. Lokaler Kontext 

3.1. Kookkurrenzanalyse 

Zur Erfassung von Regularitäten in den lokalen lexikalischen Kontexten in 
sehr großen Korpora wird am IDS meistens die Analysemethode „Statisti- 
sche Kollokationsanalyse und -clustering“ (Belica 1995) eingesetzt. Sie im- 
plementiert einen erweiterten iterativen Algorithmus zur Extraktion von Ko- 
okkurrenzen höherer Ordnung, welche als diskontinuierliche n-Tupel (im 
Unterschied zu n-Grammen) von Lexemen mit variierenden relativen Positi- 
onen zueinander (anders als positionsgebundene n-Gramme) auftreten können. 
Es werden standardmäßig Kookkurrenzen beliebiger Ordnung ermittelt, wo- 
bei das auszuwertende Kontext-Fenster dynamisch bestimmt wird. Die ex- 
trahierten Kookkurrenzen werden mit Hilfe eines Clusteringverfahrens in 
Form von Baumhierarchien angeordnet, welche die zunehmend feinkörnige 
Kookkurrenzstruktur einzelner Ordnungen visualisieren. Das Analysemodul 


ist seit 1995 in das IDS-Korpusrecherchesystem COSMAS (Corpus Search, 
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Management and Analysis System) integriert und online aufrufbar. Abbildung 
1 zeigt einen kurzen Ausschnitt aus einer Web-basierten Präsentation der 
Ergebnisse der Kookkurrenzanalyse für das Wort machen. Die in der letzten 
Spalte aufgelisteten syntagmatischen Muster (z.B. „macht sich| mir ... gro- 
ße Sorgen“) können als stellvertretende Illustrationen der eigentlichen Ko- 
okkurrenzen verstanden werden und helfen hauptsächlich, die aufgedeckten 
Kookkurrenzcluster einerseits zurück auf Sprachdaten, andererseits auf die 
Intuition eines kompetenten Sprechers zu beziehen. Sie sind oft ein nützli- 
cher Ausgangspunkt für die qualitative Interpretation einzelner Kookkurren- 
zen (vgl. Perkuhn 2007). 
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Abb. 1: Annotierte Web-Prasentation der Kookkurrenzanalyse des Wortes machen (Ausschnitt) 


Das Analysemodul ist sprachunabhängig, wie im Anhang A anhand der Ana- 
lyse des Wortes why in einem englischsprachigen Korpus illustriert wird. 
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3.2. Kookkurrenzprofile 

Die Gesamtheit aller quantitativen Ergebnisse der Kookkurrenzanalyse zu ei- 
nem gegebenen Analyseobjekt (einem Lexem, einer Wortverbindung usw.) 
wird als Kookkurrenzprofi! des Objektes bezeichnet und stellt — informell ge- 
sagt — ein Kondensat seines Gebrauchs dar. Es erfasst sowohl dominante 
Wortverbindungsstrukturen wie auch subtile Varianzphinomene im lokalen 
lexikalischen Kontext des analysierten Objektes, und bietet dadurch eine de- 
taillierte Auskunft tiber die syntagmatische und paradigmatische Einbettung 
des Objekts im Sprachgebrauch aus präferenzrelationaler’ Sicht. 


4. Globaler Kontext 

Die Argumentation zu situativen Kontexten im Abschnitt 2 ließ die Frage of- 
fen, wie diese Kontexte, in denen konventionalisierte lexikalisch-semantische 
Relationen in der Interaktion der Sprachteilnehmer ausgehandelt werden, er- 
fasst, bzw. in den Korpora aufgespürt werden können. Im Folgenden wird ge- 
zeigt, dass diese globalen Kontexte sich in der Struktur wechselseitiger Bezieh- 
ungen einer großen Anzahl von Kookkurrenzprofilen manifestieren, obwohl 
dies auf den ersten Blick überraschen mag, da Kookkurrenzprofilen nur die lo- 
kalen Kontexte zugrunde liegen. 


4.1. CCDB - das empirisch-linguistische Methodenlabor 

Um die wechselseitigen Beziehungen zwischen Kookkurrenzprofilen eingeh- 
end untersuchen zu können, wurde im Jahr 2001 am IDS eine „korpuslingui- 
stische Denk- und Experimentierplattform für die Erforschung und theoreti- 
sche Begründung von systemisch-strukturellen Eigenschaften von 
Kohäsionsrelationen zwischen den Konstituenten des Sprachgebrauchs“ (s. 
Keibel / Belica 2007) begründet. In ihrem Kern enthält sie große Volumina 
sekundärer empirischer Daten, eine Kookkurrenzdatenbank, die durch mehr- 
fache, unterschiedlich parametrisierte Kookkurrenzanalysen des gesamten 
Grundformenvokabulars eines großen Korpus® errechnet wurde. Derzeit ent- 
hält sie mehr als 220.000 nicht-triviale Kookkurrenzprofile pro Parametersatz, 
bis zu 250 Top-Level-Clusterknoten pro Kookkurrenzprofil und bis zu 
100.000 Konkordanzzeilen pro Kookkurrenzcluster. Da diese Analysen mit 
Hilfe des im Abschnitt 3.1 beschriebenen Analysemoduls durchgeführt wur- 
den, kann prinzipiell jede CCDB-Kookkurrenz über das COSMAS-System 


5 Vgl. „Generalisierungen über Ähnlichkeitsbeziehungen nennen wir allgemein Präferenzrelationen.“ bei Ku- 
pietz und Keibel (2009 b: 45); Hervorhebung im Original. 


6 Stand November 2008: Dies ist ein ca. 2,2 Milliarden laufende Textwörter umfassendes, auf DEREKo basie- 
rendes virtuelles Korpus ccdb-2007. 
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online rekonstruiert und nachvollzogen werden. Die Kookkurrenzdatenbank 
ist im Sinne eines „gläsernen Labors“ teilweise online zugänglich unter 
<http://corpora.ids-mannheim.de/ccdb/>. 


4.2. Paarweiser Vergleich von Kookkurrenzprofilen 

Vergleicht man synoptisch die Kookkurrenzprofile zweier Worter, die intuitiv als 
„ähnlich“ empfunden werden, z.B. die eines synonymischen Paares, so stellt man 
fest, dass sich auch diese Kookkurrenzprofile teilweise ahneln, sie weisen leicht er- 
fassbare partielle Ubereinstimmungen in ihren Kookkurrenzclustern auf. In der Ab- 
bildung 2 sieht man beispielsweise, dass die Kookkurrenzprofile von grinsen (links) 
und Jicheln (rechts) bereits in ihren ersten Zeilen vier Bereiche mit teilweiser Über- 
lappung haben, wobei die Gemeinsamkeiten die Kookkurrenzen mit den Wortern 
sagt, verschmitzt, freundlich und verlegen betreften. 
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Abb. 2: Synoptischer Vergleich der Kookkurrenzprofile von grinsen und lächeln 


Im Umkehrschluss wird angenommen, dass man Objekte, deren Kookkurrenzprofi- 
le messbare Uberlappungen aufweisen, als in ihrem Gebrauch ähnlich bezeichnen 
kann. Es bleibt eine offene Forschungsfrage, wie ein optimales Ähnlichkeitsmaß für 
Objekte mit der Komplexität von Kookkurrenzprofilen konzipiert sein soll. Das 
derzeit in der CCDB verwendete Maß beruht auf dem Termfrequenz/Suchwort- 
dichte-Ansatz (¢-idf s. zum Beispiel Salton 1989: 348). Einen ersten Eindruck da- 
von, welches Konzept von Ähnlichkeit dieses Maß operationalisiert, gewinnt man, 
indem man zu einem gegebenen Wort die Wörter ausgeben lässt, die mit ihren Ko- 
okkurrenzprofilen dem Wort gemäß diesem Maß am stärksten ähneln. Als ein Bei- 
spiel zeigt Abbildung 3 die Liste der 20 Wörter, deren Kookkurrenzprofile in der 
CCDB dem Kookkurrenzprofil des Wortes Hindi am ähnlichsten sind. 


163 


164 


Cyril Belica 


1. Chinesisch 8. Arabisch 15. Hebräisch 

2. Englisch 9. Italienisch 16. Ungarisch 

3. Spanisch 10. Landessprache 17. Amtssprache 
4. Türkisch 11. Polnisch 18. Tschechisch 

5. Urdu 12. Französisch 19. Russisch 

6. Portugiesisch 13. Muttersprache 20. Niederländisch 
7. Japanisch 14. Griechisch 


Abb. 3: Wörter mit Kookkurrenzprofilen, die dem von Hindi am ähnlichsten sind 


Während die intuitiv leicht nachvollziehbare Ähnlichkeit dieser Wörter - im 
Sinne von semantischer Nähe — zu Hindi unspektakulär ist, da es sich über- 
wiegend um Fälle von Kohyponymie handelt und manche dieser Beziehungen 
möglicherweise bei Priming-Experimenten signifikant häufig elizitiert wür- 
den, ist die Situation bei dem Wort Charakteristikum (s. Abbildung 4) spürbar 
komplexer und jede Vorwegnahme von Ergebnissen experimentalpsychologi- 
scher Untersuchungen erscheint hier fragwürdig und unseriös. 


1. Merkmal 8. Element 15. Stilmittel 

2. Eigenheit 9. Besonderheit 16. Parameter 

3. Eigenschaft 10. Charaktereigenschaft 17. Charakter 

4. Eigenart 11. Ausformung 18. Eigentümlichkeit 
5. Ausprägung 12. Stilelement 19. Ereignis 

6. Charakteristik 13. Kriterium 20. Spielart 

7. Anliegen 14. Charakterzug 


Abb. 4: Wörter mit Kookkurrenzprofilen, die dem von Charakteristikum am ähnlichsten sind 


Im Allgemeinen kann man den folgenden Zusammenhang erwarten: Je facet- 
tenreicher die (denotativen und konnotativen) semantischen Strukturen sind, 
die mit einem Lexem (d.h. nicht mit einem seiner Denotate) typischerweise as- 
soziiert werden, desto heterogener und divergenter ist die Menge der Lexeme, 
die ihm in ihrem Gebrauch ähnlich sind. Diese Vermutung wird im Folgenden 
weiter erkundet. 

Zusammenfassend soll an dieser Stelle betont werden, dass eine begleitende 
interdisziplinäre sprachpsychologische Untersuchung von Ähnlichkeitsrelatio- 
nen und -strukturen zwischen Lexemen für eine adäquate korpuslinguistische 
Modellierung lexikalischer Semantik unverzichtbar ist, und dass sie eine min- 
destens ebenso große Herausforderung wie die meistens leider allein disku- 
tierte mathematisch-statistische Operationalisierung darstellt. Sobald die 
Sprache selbst, und nicht z.B. die durch sie transportierte Information empi- 
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risch untersucht und erschlossen werden soll, muss der Bezug zu den kognitiv- 
psychologischen Wurzeln von Sprache nicht nur umrissen werden, sondern in 
der gesamten Forschungsmethodik durchgehend aufrechterhalten bleiben. 


4.3. Vergleich von mehreren Kookkurrenzprofilen 

Die im Abschnitt 4.2 skizzierten Uberlegungen zur partiellen Ähnlichkeit 
zweier Lexeme (basierend auf partieller Ähnlichkeit ihrer Kookkurrenzprofile) 
kann man mit dem folgenden Gedankenexperiment fortführen: Wie oben an- 
gedeutet, ist es möglich, zu einem gegebenen Lexem A eine Menge von Lexe- 
men È zu nennen, die dem Lexem A in seinem Gebrauch ähnlich sind. Dabei 
können diese Lexeme auf sehr unterschiedliche Art zu X ähnlich sein, d.h. sie 
können jeweils einen sehr spezifischen Verwendungsaspekt mit A teilen. Hat 
man einen sehr großen Vorrat an „verschiedenartig“ ähnlichen Lexemen in X 
zur Verfügung, so „berühren“ diese das Lexem A von jeweils unterschiedlichen 
Seiten, sie bringen jeweils andere Verwendungsaspekte von X zum Ausdruck. 
Im Idealfall wäre man in der Lage, zu jedem bekannten Verwendungsaspekt 
des Lexems A mehrere Lexeme aus der Vorratsliste & zu nennen, die eben die- 
sen Verwendungsaspekt mit A teilen. Wäre es dann zusätzlich möglich, die Le- 
xeme aus È so zu Teilmengen zu gruppieren, dass jede Teilmenge einem der 
sich abzeichnenden Verwendungsaspekte entspricht, so könnte man sagen, 
dass diese Teilmengen das Lexem A Aspekt für Aspekt „abgetastet“, „kartiert“ 
und dadurch letztendlich bestimmt haben — etwa so, wie man mit geschlosse- 
nen Augen durch Abtasten einen Gegenstand zu erfassen versucht. 

Etwas formaler ausgedrückt: Über die Analyse der Struktur der Kookkurrenz- 
profile und des multidimensionalen Vektorraumes, den diese Kookkurrenzpro- 
file vermöge einer Ähnlichkeitsmetrik aufspannen, gelangt man zu Erkennt- 
nissen über die Struktur bestimmender Verwendungsaspekte von lexikalischen 
Einheiten, insbesondere über die Struktur ihrer lexikalisch-semantischer Rela- 
tionen. Im Sinne der im Abschnitt 2 zitierten Maxime „[...] sich dem Unter- 
suchungsgegenstand Sprache mit möglichst wenigen Vorannahmen über die- 
sen Gegenstand selbst zu nähern“, wird dazu, d.h. zur Analyse bzw. 
Dimensionsreduktion des Vektorraumes, der Ansatz von neuronalen Netzen — 
in Form von selbstorganisierenden Merkmalskarten — aufgegriffen. Abbildung 
5 zeigt eine mögliche lexikalische Merkmalskarte für das Lexem Quark. 
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Abb. 5: Selbstorganisierende lexikalische Merkmalskarte” für das Lexem Quark 


Diese Merkmalskarte enthält ausschließlich Lexeme, deren Kookkurrenzpro- 
file dem Kookkurrenzprofil des Lexems Quark besonders ähnlich sind. Sie 
wurden mittels Selbstorganisation so angeordnet, dass die topografische Nähe 
der Lexeme auf der Fläche möglichst der Ähnlichkeit ihrer Kookkurrenzpro- 
file untereinander entspricht. So sind z.B. die Kookkurrenzprofile von Konfi- 
türe und Süßspeise nicht nur beide dem Kookkurrenzprofil von Quark ähnlich, 
sondern sie sind — so folgert man — auch untereinander ähnlich, da sie sich im 
Verlauf der Selbstorganisation nahe beieinander, in demselben Quadrat (s. lin- 
ke untere Ecke der Merkmalskarte) stabilisiert haben. In der größten Entfer- 
nung davon, im Eckquadrat rechts oben, findet man allerdings Lexeme, die 


7 Die Vergrößerung der zwei im Text diskutierten Quadrate in dieser Abbildung ist nicht ein Bestandteil der 
automatischen Visualisierung und wurde zwecks besserer Übersichtlichkeit nachträglich von Hand vorge- 
nommen. 
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man zwar auch leicht mit dem Lexem Quark, kaum aber mit den Lexemen 
Konfitüre oder Süßspeise assoziiert, z.B. Proton, Neutron, Elektron. Es liegt da- 
her nahe anzunehmen, dass das Lexem Quark in mindestens zwei? unter- 
schiedlichen globalen, situativen Kontexten gebraucht wird, die hier verkiirzt 
als Milchprodukt-Kontext und Elementarteilchen-Kontext bezeichnet werden’. 
In Anlehnung an die Argumentation im Abschnitt 2, wonach man „den ver- 
möge gradueller Ähnlichkeit zwischen Situationen und Kontexten entstande- 
nen unscharfen Konzeptualisierungen von sprachlichen Phänomenen [...] mit 
Hilfe von A-posteriori-Klassifikationen eine Pseudo-Identität verleihen kann 
(um sie symbolisch referenzierbar zu machen)“, würde man z.B. aus lexikogra- 
fischer Sicht das in diesem trivialen Beispiel „aufgedeckte“ Phänomen mögli- 
cherweise als Homonymie klassifizieren. Die Maxime, sprachsystembezogene 
Generalisierungen — z.B. die Abbildung von emergenten Phänomenen auf 
sprachsystemische Kategorien — möglichst erst nachgelagert, a posteriori durch- 
zuführen, gehört zu den Grundpfeilern der in diesem Beitrag vorgestellten 
Methodik. 

Im Allgemeinen ist die linguistische Interpretation von selbstorganisierenden 
lexikalischen Merkmalskarten eine nichttriviale Herausforderung. Vachkovä 
und Belica (2009) arbeiten die Methodik einer im Diskurs verankerten semio- 
tischen Interpretation derartiger Merkmalskarten aus und zeigen, dass die 
emergenten Zeichen intersubjektiv auf das mentale Lexikon bezogen werden 
können („re-anchorling] [of] the representamen to a substitute semiotic ob- 
ject in [...] mental lexicon.“). Sie stellen fest, dass der zu interpretierende Sig- 
nifikant kein einzelnes Lexem, sondern „a blurred group of topologically close 
lexemes“ ist und charakterisieren dessen semiotisches Objekt als „the quality 
of the common pair-wise relationship between its constituent lexemes“. Da- 
raus folgern sie: 


Since the quality of the underlying relationship — in the sense of ‘explication - is available neither 
in the corpus nor in the self-organizing map, an attempted semiosis, i.e., rendering the supersign 
meaningful, requires that its emergent semiotic object be sought in the point of intersection of the 
individual semiotic objects resulting from their interaction within the mental lexicon due to their 


connotative potential. 


8 Auf einen weiteren globalen Kontext des Lexems Quark, nämlich Unsinn, kann hier aus Platzgründen nicht 
näher eingegangen werden. 


9 Esistnurein Zufall, obgleich ein sehr willkommener, dass die zwei diskutierten Quadrate jeweils auch das 
Lexem beinhalten, das direkt zur Kennzeichnung der zwei erwähnten globalen Kontexte verwendet werden 
konnte, nämlich Milchprodukt und Elementarteilchen. 
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Die im Anhang B abgebildete, teilweise interpretierte und annotierte lexikali- 
sche Merkmalskarte für das Wort G/as soll die hier skizzierte Gedankenfüh- 


rung illustrieren. 


5. Verwandte Fragestellungen und Anwendungsszenarien 

Im Vorangegangenen wurde eine aus mehreren Schritten bestehende Metho- 
dik dargestellt. In diesem Abschnitt werden drei Themengebiete skizziert, in 
denen die Ergebnisse bestimmter Teile dieser Methodik verwendet werden 
können. 


5.1. Synonymie und Plesionymie 

Erstellt man eine kombinierte lexikalische Merkmalskarte für ein Paar von se- 
mantisch verwandten Lexemen, indem man alle Lexeme, die mindestens ei- 
nem der beiden Lexeme ähnlich sind, dem Prozess der Selbstorganisation ge- 
meinsam unterzieht, so treten die Gemeinsamkeiten und Unterschiede in der 
Verwendung einzelner Wörter des untersuchten Wortpaares deutlich hervor. 
Diese Analysemethode (Contrasting Near Synonyms, Belica 2006) kann u.a. 
zum Aufspüren und Dechiffrieren von feinen Bedeutungsdifferenzen bei Qua- 
sisynonymen verwendet werden (vgl. Vachkovä / Belica, 2009 und Schmidts 
Analyse von genau in Vachkovä / Schmidt / Belica 2007: 18-20). 

Abbildung 6 zeigt eine kombinierte lexikalische Merkmalskarte für das Wort- 
paar Einsamkeit/Zweisamkeit. Die Grauschattierung des Hintergrunds einzel- 
ner Quadrate entspricht dem Anteil, in dem die darin aufgelisteten Lexeme 
einem der kontrastierten Wörter im Gebrauch ähnlich sind, von weiß (ent- 
spricht dem globalen Kontext von Einsamkeit), über hellgrau (deutet auf glo- 
bale Kontexte hin, mit denen sowohl Einsamkeit wie auch Zweisamkeit assozi- 
iert werden könnten) bis dunkel (Situationen, die man typischerweise mit 
Zweisamkeit, nicht aber mit Einsamkeit verbindet). 


10 Die Wahl der Grauschattierung in dieser Publikation ist drucktechnisch bedingt. Im Original wird zur 
Visualisierung des Ahnlichkeitsgrades in den einzelnen Quadraten eine unterschiedliche Farbgebung für 
die Ausgangswörter (gelb bzw. rot) verwendet. 
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Einsamkeit 


Erniedrigung Sinnlosigkeit Weite Alleinsein 

Schmerz Vergänglichkeit Erhabenheit Sehnsucht unerfüllt 
Qual Tragik Sinnbild Intimität Liebe 
Entbehrung Endlichkeit unendlich Zartheit unstillbar 
Demitigung thematisiert Unendlichkeit Schwermut Leidenschaft 
Leid Unmöglichkeit Gefühlswelt Empfindsamkeit Verliebtheit 
Mühsal Fremdsein Metapher Geborgenheit Verlangen 
Pein Dasein Freiheit Vergeblichkeit Zuneigung 
Not Ausweglosigkeit Verlassenheit Zerrissenheit Lebenslust 
Depression Heimatlosigkeit Langeweile Melancholie grenzenlos 
Hunger ausweglos Trostlosigkeit Trauer Suff 
Neurose existentiell Leere Enttäuschung Gier 
Alkoholismus Elend Tristesse Auflehnung Todessehnsucht 
Anfall existenziell Stille Gefühl Eifersucht 
Krankheit Entwurzelung Düsternis Empfindung Geldgier 
Drogensucht Selbstzerstörung versinken Verzweiflung abgründig 
Vereinsamung Orientierungslosigkeit Hoffnungslosigkeit Resignation Wut 
Isolation Erstarrung Ohnmacht Verbitterung Selbstmitleid 
Teufelskreis Vereinzelung Hilflosigkeit Aggression Bitterkeit 
Armut Perspektivlosigkeit Sprachlosigkeit Frust Scham 
Verwahrlosung Erschöpfung Apathie breitmachen Selbsthaß 
Verarmung Überforderung Frustration Fassungslosigkeit Selbsthass 
Befindlichkeit Aussichtslosigkeit Ratlosigkeit gewichen abgrundtief 
Verelendung Desorientierung Niedergeschlagenheit umschlagen Angst 


Abb. 6: Lexikalische Merkmalskarte für das Wortpaar Einsamkeit/Zweisamkeit. 


5.2. Lexikografie und Lexikologie 

Ein erstes Anwendungsgebiet, das sich aufgrund des bereits Gesagten anbie- 
tet, ist die korpuslinguistisch abgesicherte Lexikografie. Der oben erwähnte 
emergente Charakter der lexikalisch-semantischen und lexikalisch-syntakti- 
schen Strukturen (vgl. z.B. Bybee 1998: 421 in Anlehnung an Hopper 1987) 
sowie die fruchtbare Verquickung von Welt- und Sprachwissen (vgl. Adam- 
ska-Sataciak 2006: 47) sind zwei Aspekte, die die moderne Lexikografie 
besonders betont. Sie sind zugleich als zwei bedeutende Analyseperspektiven 
bei der Bedeutungserfassung zu nennen: Die oben vorgestellte korpusanalyti- 
sche Methodik lenkt den Lexikografen in die richtigen Bahnen immer dann, 
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wenn er in Gefahr lauft, Worter als feste Entitaten von Form und Bedeutung 
wahrzunehmen, bzw. diese auf abstrakte Art und Weise unabhängig vom Kon- 
text zu umschreiben (anstatt sie z.B. mit semiotisch aussagekräftigem Wort- 
material zu belegen). 

Der kontext- bzw. diskursbedingte Facettenreichtum spielt auch bei der Aus- 
wahl von Synonymen oder anderen zum Stichwort äquivalenten Ausdrücken 
eine eminente Rolle, von der die Qualität der lexikografischen Erfassung eines 
Wortes (bzw. einer Wortkombination) abhängt: Der Kontrast zwischen der le- 
xikografischen Bearbeitung, die sich nur unmittelbar und hermeneutisch auf 
Korpusbelege stützt, und dem hier angedeuteten Ansatz, der sich die hier vor- 
gestellte Auffassung der lexikalisch-semantischen Beziehungen zu eigen 
macht, kann als eine Triebkraft der lexikografischen Arbeit verstanden werden. 
Als Beispiel kann eine neu zu entwerfende konzeptuelle Auffassung von anto- 
nymischen/synonymischen Beziehungen dienen, bei der die skalare Beschaf- 
fenheit der Gegensätze diskursgebunden betrachtet wird (vgl. Vachkovä, 
2010). Dies ist eine Herausforderung nicht nur für die Lexikografie, sondern 
auch für die korpusbasierte Lexikologie. 

Hiermit ist bei der Anwendung der korpuslinguistischen Methodik die Frage 
nach der Vernetzung eines Wortes im Rahmen der paradigmatischen Bezieh- 
ungen und nach der Eruierung der Wortbedeutung auf einer qualitativ neuen 
Ebene zu beantworten. Daraus resultiert eine Auffassung von lexikalischen 
Relationen, die nicht von der a priori verankerten Kategorisierung ausgeht: 
Das Einbeziehen von Kookkurrenzprofilen in die lexikografische Arbeit be- 
deutet, einen schnellen und übersichtlichen Zugriff auf eine assoziativ signifi- 
kante Diskursmenge als Orientierungsskelett zur Verfügung zu haben. 

Die laufende Forschung, die sich mit der linguistischen Interpretation von le- 
xikalischen Merkmalskarten befasst, deutet darauf hin, dass der Prozess, in 
dem sich das kommunikative Potential der Sprache realisiert, als emergente 
Struktur visualisierbar ist. Die am Prozess der Selbstorganisation beteiligten 
Kookkurrenzprofile zeigen sich dabei sowohl bedeutungskonstituierend wie 
auch bedeutungsrelativierend. Vachkovä (in Vorbereitung) merkt an: 

Die Erfahrung, dass eine diskursbasierte Interpretation von Assoziationsnet- 
zen z.B. die lexikografische Bearbeitung von schwierigen Abstrakta besser 
steuert als eine abstrakte Bedeutungsumschreibung, erhärtet die Schlussfolge- 
rung von Schwanenflugel: „When abstract and concrete words are placed in 
highly supportive contexts [sprich: in Clustern von Kookkurrenzprofilen], the 
preactivation of contextual knowledge [sprich: durch Assoziationen evoziertes 
Diskurswissen, das an Weltwissen gekoppelt ist] should override processing [dzw. 
priming] difficulties for abstract words*. 


Semantische Nahe als Ahnlichkeit von Kookkurrenzprofilen 


Da die der Methodik zugrundeliegende iterative Kookkurrenzanalyse neben 
binären Wortrelationen auch ganze phrasale Muster erfasst, eröffnen sich au- 
ßerdem der Lexikografie — auf sehr große Korpora gestützt — nahezu uner- 
schöpfliche Möglichkeiten zur Inventarisierung, Klassifikation und Beschrei- 
bung usueller Wortverbindungen — z.B. Phraseologismen, Redewendungen, 
Sprichwörter, kommunikative Formeln, Funktionsverbgefüge — und der in ih- 
nen vorkommenden (insbesondere paradigmatischen) Variation. 


5.3. Didaktik 

Ein drittes Themengebiet betrifft nur einen Teil der oben dargestellten Me- 
thodik: die syntagmatischen Muster. Aus der in diesem Aufsatz eingenomme- 
nen Perspektive auf den sprachtheoretischen Status usueller Wortverbindun- 
gen, wie sie sich in den syntagmatischen Mustern (s. Abschnitt 3.1) 
manifestieren, dass sie nämlich psychologisch real sind, liegt es nahe, ihren Stel- 
lenwert auch im didaktischen Kontext zu überprüfen. Unter dem Arbeitstitel 
simulated late partial immersion wird am IDS eine weitere Anwendungsmég- 
lichkeit diskutiert mit der Zielvorstellung, ein Kompendium usueller Wortver- 
bindungen ftir Deutschlernende zu konzipieren. Der Entwurf sieht vor, dass 
zuerst aus der Kookkurrenzdatenbank CCDB solche syntagmatischen Muster 
extrahiert werden, in denen lediglich Kookkurrenzpartner aus einem gewahl- 
ten Lernervokabular vorkommen. Diese werden dann redaktionell gepriift, ggf. 
korrigiert und didaktisch aufbereitet, und wahlweise — auf halbautomatischem 
Wege — um Beispiele ihrer Verwendung im Korpus ergänzt. Das vielschichtige 
Zusammenspiel von Faktoren wie Sprachanlass/-situation und Lernniveau 
könnte je nach Zielpublikum angemessen berücksichtigt werden, da es mög- 
lich wäre, das dem Kompendium zugrundeliegende Vokabular in seinem Um- 
fang und in seiner Zusammensetzung praktisch ohne zusätzlichen Aufwand 
beliebig zu variieren. Aufgrund der großen systematischen (v.a. paradigmati- 
schen) und idiosynkratischen Variation der äußeren Formen dieser Kookkur- 
renzverbindungen ist es allerdings nicht einfach, für sie eine Art kanonische 
Grundform einzuführen und ggf. zu operationalisieren, die ihr jeweils eine für 
didaktische Zwecke hinlänglich fassbare Identität verleihen würde. 

Heringer (2007) berichtet von einem gemeinsamen Experiment in diesem 
Sinne unter Verwendung eines erweiterten Zertifikatsvokabulars mit ca. 2500 
hochfrequenten Grundformen. Er nennt diese Wortverbindungen „Valenz- 
Chunks“ und gibt interessante Beispiele für ihre didaktisch motivierte Aufbe- 
reitung. Anhang C listet einige Beispiele für syntagmatische Muster, die in 
diesem Experiment verwendet wurden, in ihrer ursprünglichen, nicht aufbe- 
reiteten Form auf. 
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6. Zusammenfassung 

In diesem Beitrag wurde der Begriff der semantischen Nahe aus einer emergen- 
tistischen Perspektive vor dem Hintergrund eines korpusgeleiteten empirisch- 
linguistischen Ansatzes diskutiert. Es wurde eine konsistente und für die ex- 
plorative Erforschung von Sprache mit explanatorischem Anspruch adiquate 
Methodik vorgestellt, die sich ihrem Untersuchungsgegenstand mit möglichst 
wenigen Vorannahmen über diesen Gegenstand selbst nähert. Die Methodik 
wurde in vier Schritten präsentiert: 

Auf einer Erweiterung des Begriffs der Kookkurrenz aufbauend wurden zuerst 
Kookkurrenzprofile als kondensierte Aufzeichnungen einer psychologisch realen 
syntagmatischen und paradigmatischen Einbettung lexikalischer Einheiten im 
Sprachgebrauch aus präferenzrelationaler Sicht konzeptuell eingeführt. Gelei- 
tet von einem weit gefassten kognitiven Prinzip der Ähnlichkeit — als einem 
graduellen Gegenkonzept zur Identität — wurde ein Vektorraum von solchen 
Kookkurrenzprofilen auf der Basis eines sehr großen Korpus konstruiert. Im 
zweiten Schritt wurde dargelegt, dass dieser Vektorraum mit Hilfe von geeig- 
neten analytischen Methoden — den se/bstorganisierenden Merkmalskarten — auf 
seine Struktur untersucht werden kann. Der dritte Schritt bestand darin zu 
zeigen, dass die aufgedeckten Strukturen als emergente Zeichen mittels einer im 
Diskurs verankerten semiotischen Interpretation zu den globalen Kontexten, in 
denen sich die Entstehung und Festigung denotativer und konnotativer As- 
pekte lexikalisch-semantischer Relationen im konkreten Sprachgebrauch er- 
eignet, intersubjektiv zurückverfolgt werden können. Die Forderung, sprach- 
systembezogene Generalisierungen — z.B. die Abbildung von emergenten 
Phänomenen auf sprachsystemische Kategorien — erst nachgelagert, a posteriori 
durchzuführen, war schließlich Gegenstand des vierten Schritts. 

Weitere Fortschritte und eine auf experimentelle Daten gestützte Argumenta- 
tion werden von den geplanten interdisziplindren Untersuchungen im Schnitt- 
punkt von Korpuslinguistik, Psycholinguistik und kognitiver Psychologie er- 
wartet. 
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Anhang A 

Der folgende Ausschnitt aus den Ergebnissen der Kookkurrenzanalyse des 
Wortes why illustriert die Sprachunabhängigkeit der verwendeten Analyseme- 
thode. Diese Analyse wurde in einem ad-hoc zusammengestellten Geschäfts- 
englisch-Korpus mit etwa zwei Millionen laufenden Wortern durchgefthrt. 


Analyse , Analysetyp 0 

m-1-11 reason one main 1 100% reason ... main one why 

n reason one 64 96% is one reason [...] why the 

n reason main 21 90% Thelthe main reason why the 
n reason One 24 100% One reason |. | why the 

n reason 181 100% is one reason |...) why the 


a-1-1 1282 explain helps 


23 100% This helps [to] explain |...) why ... the 


n explain may help 3 100% may help (to) explain why 

explain may 28 96% This may |...) explain why the 

n explain help 13 100% may|miaht help [to] explain why 

n explain 113 100% helps maylto explain [...] why 

m-1-1 575is That 78 83% That [...] is [...] why the 

n is easy It 13 92% Itis easy to see why 

n is easy 19 89% Itlit is |...) easy to see why 

n is It 21 90% It is easy to see why the 

n is 393 71% That is |... reason] why the 

m-1-1 543 explains This partly 3 100% This [...] partly explains why 

n explains This 12 100% This [partly] explains why 

n explains partly 7 100% This partly explains why the 

n explains 49 100% This explains [...) why the 

m-1-1 528 reasons There are several 7 85% There are several reasons why 

n reasons There are 23 78% There are severalltwo reasons why 
n reasons There 24 100% There are severallmany reasons why 
n reasons are several 9 88% There are several reasons why 

n reasons are 34 82% Therelthere are [several|two] reasons why the 
n reasons several 11 100% There|there are several reasons why 
n reasons 57 100% are ... reasons |...) why the 

m-4-2 527 That Fund 3 100% That is why [the] Fund 

n That 106 100% That is ... why the 

m-2-2 302one 76 93% is one [reason] why the 

m-1-1 247 see hard It 1 100% It ... hard ... see why 

u see 43 95% easy|hard to see [...] why 

m-4-2 235 This 75 100% This is ... explain why 

a 13 226should no 14 92% there is no reason why |...| should not 
a should be 16 93% why |...) should |...) be 

a should 65 98% reason why |...) should be 

m-3-2 178helps 24 95% This helps to explain why ... the 

= 11 162the government 12 83% That reasonlis why [...] the [...] government ... to 
n the 368 68% is why [...] the 

m-5-4 153 There 32 100% There is|are several reason|reasons why the 
m-2-2 152main 25 96% Thelthe main reason why the 

u-5-2 150Which 18 100% Which is|may explain why the 

m-3-3 140easy 22 95% Itlit is easy [to see] why 

m-2-2 134 One 31 100% One reason why the 

m 11 129theydo 6 they do not ... why 

n they 68 76% why [...] they 

m-2-2 118to 241 53% to [seejexplain] why 

m-1-1 101 understand it To 2 50% To understand why it 

n understand 12 100% Talta understand why 


Abb. 7: Ergebnisse der Kookkurrenzanalyse von why (Ausschnitt) 
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Anhang B 
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Abb. 8: Teilweise interpretierte und annotierte lexikalische Merkmalskarte zu Glas 
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Anhang C 

Dieser Anhang zeigt einige Beispiele fiir syntagmatische Muster aus der Ko- 
okkurrenzdatenbank CCDB, in denen als Kookkurrenzpartner ausschließlich 
Wortformen aus dem erweiterten Zertifikatsvokabular mit ca. 2500 hochfre- 


quenten Grundformen vorkommen, vgl. Abschnitt 5.3. 


war [... ein] voller [...] Erfolg 
nichts zu tun [...] haben 

in letzter Sekunde 

kann [es ...] passieren daß 
nicht [mehr] bezahlen 

Licht ins Dunkel 

tiefer in die Tasche [...] greifen 
mit leeren [...] Händen da... 
kann nicht [...] schaden 


Ich habe [... den] Eindruck dass|daß ... 


die Nase [...] vorn [zu] haben 
in der kalten [...] Jahreszeit 
fehlt [nur] noch 


steht [... ganz im] Zeichen des|der ... 


ganz besonders 

Das gilt [...] auch für die 
allerdings [...] noch nicht ... 

an allen Ecken und Enden 
wird|es noch [... Jahre] dauern bis 
lässt... zu wünschen [...] übrig 
schon einmal 

gerade mal 

paßt [...] gut... auf 

eine ... Rolle [...] gespielt 
funktioniert [...] nicht [...] mehr 
eine Lésung [zu] finden 

ganz schòn 

mit dem Riicken zur Wand 

wer weiß 

wieder auf freiem [...] Fuß angezeigt 
Rede und Antwort [...] stehen 
an|An erster [...] Stelle 

viel Glück 

Glück gehabt 

Glück [im] Unglück hatte ... 
ebenso [...] wie die ... 

und manchmal [...] sogar 

ist ... der Meinung 

kommt nicht von ungefähr 

an den Start [...] gehen 

fast überall 

in deutscher Sprache 

ist [... für... nicht] geeignet 

ist [...] typisch für ... 


überall auf]in der Welt 

das Maß der|aller Dinge 

ist [noch] offen 

richtet sich in erster Linie gegen|an die 
für frischen [...] Wind in die 

auf die Art und Weise wie ... 

ein Zeichen [... zu] setzen 

ein Lied [davon zu] singen 

wohl [...] nicht 

in die Tasche [...] greifen 

in der Nacht [zum|auf] Sonntag 
war ein voller [...] Erfolg 

sieht [das ...] anders aus 

schon mal 

dient in erster Linie der ... 

die|der leeren [...] Kassen 

an die frische [...] Luft 

in Verbindung [...] gebracht werden 
erst einmal 

am runden Tisch 

zum Opfer [...] gefallen 

leer ausgehen 

will [... nichts] wissen 

nicht [so] recht 

in Frage [...] gestellt 

ist noch [...] offen 

in den ewigen [...] Frieden heimgeholt 
Sprung ins kalte [...] Wasser 

Es hat [... viel] Spaß [...] gemacht 
unter Dach und Fach [zu] bringen 
in Verbindung [zu] setzen 

unter Dach [und] Fach [...] gebracht 
werden 

auf Eis [...] gelegt 

Rede und Antwort stehen 

auf frischer Tat ertappt ... 

in|ins Krankenhaus 
eingeliefert|gebracht] werden 

Es ist [... kein] Zufall daß 
Professor für ... [an der] Universität 
in der Nacht [zum|auf] Freitag 
braucht [...] nicht zu 

Rechnung [zu] tragen 

stieg die Zahl der... 

wird nicht [...] müde zu 


Grund zum Feiern 

ja oder nein 

die Tür [und Tor] geöffnet 

eine ganze Menge 

in der Nacht [zum] auf] Dienstag 
in erster Linie 

eine ganz normale 

macht [...] Spaß 

grünes [...] Licht für ... 

ernst [zu] nehmen 

nicht ernst [...] genommen werden 
Temperaturen von|um|bis ... Grad 
eine ... Rolle [...] spielen 

ins Leben [...] gerufen 

unter Dach und Fach 

spielt [... keine [eine ...] Rolle 

zur Kasse [...] gebeten werden 
Auflauf den ersten [...] Blick 
über weite [...] Strecken 

zu wünschen [...] übrig 

die Nase [...] vorn 

nicht [...] anders als 

nicht [...] nur [... sondern] auch 
grünes [...] Licht [für ...] gegeben 


kann [sich|mir nicht] vorstellen daß ... 


noch [...] lange nicht ... 

Ich glaube [...] nicht daß |dass ... 
einen Beitrag [zur ... zu] leisten 
Kilometer [von ...] entfernt 


mehr oder weniger 

nur noch 

Erfahrungen [... zu] sammeln 
nicht wirklich ... 

in den eigenen [...] vier [...] Wänden 
steht ganz im Zeichen des|der ... 
schon [...] lange nicht mehr 
wohl [...] auch 

sich|mir nicht [...] vorstellen daß 
erst einmal 

Antworten [auf die ...] Fragen 
miteinander [...] verbunden sind 
nicht gefallen [...] lassen 

legt [...] Wert darauf] auf die 


grünes Licht [für ...] geben 
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Zur Überprüfung von Schreibleistungen an 
Schulùbergangen am Beispiel Mittelschule- 
Oberschule in Südtirol 


Annemarie Saxalber - Freie Universität Bozen 
Rita Gelmi - Freie Universität Bozen 


Abstract 

Im Beitrag werden Prüfungskultur und Schreibleistungen an der Nahtstelle Mittel- / 
Oberschule der deutschen Schule in Südtirol in den Blick genommen?. Wir konzen- 
trieren uns dabei auf die schriftliche Abschlussprüfung der Mittelschule (8. Schul- 
stufe) im Fach Muttersprache Deutsch und im Fach Zweitsprache Italienisch. Es 
geht vor allem um eine kritische Beleuchtung der in den vorliegenden Dokumenten 
sichtbaren Prüfungskultur und deren innerer Stimmigkeit. Wir fragen danach, wie 
klar, transparent und kohärent in der Aufgabenstellung und in der Bewertung bei 
Prüfungen umgegangen wird und inwieweit dabei auch Sprachlernbezüge, die für 
den Start in die nächste Bildungsstufe aufschlussreich sind, hergestellt werden. Am 
Beispiel der schriftlichen Prüfungsaufgaben aus Deutsch/Muttersprache und Italie- 
nisch/Zweitsprache soll die Bildungsdiskussion um einen koordinierten Sprachenun- 


terricht ein Stück weitergebracht werden. 


1. Einleitung 

Die Prüfungshandlungen bei Abschluss einer Schulstufe greifen in das Selbst- 
verständnis eines jungen Menschen meist mehr ein, als es den Erwachsenen 
bewusst ist: Klaffen die gewonnene Selbsteinschätzung und die in einem Prü- 
fungsakt festgehaltene Fremdbeurteilung zu Befähigungen arg auseinander, so 
wird die daraus resultierende persönliche Verunsicherung oft in die nächste 
Ausbildungsstufe mitgenommen. Dies kann den Start unvorteilhaft beeinflus- 


sen, zumal gerade in der Übertrittsphase auch die individuelle Betreuung der 
Schülerin/des Schülers vom Wechsel betroffen ist. 


1 Der vorliegende Beitrag beruht auf einem Input der Autorinnen anlässlich der Herbsttagung für die Schulführungs- 
kräfte an der Deutschen Schule in Südtirol, Sekundarstufe I und II, organisiert vom Deutschen Schulamt in Brixen/ 
Cusanus Akademie am 22.10.08. In der Zwischenzeit haben sich die gesetzlichen Unterlagen zu den Abschlussprü- 
fungen verändert. Dies wurde im Artikel berücksichtigt. Es handelt sich hier nicht um eine repräsentative Untersu- 
chung; die Beispiele sollen die Beobachtungen, die die Autorinnen in vielfältigen schulischen Prüfungssituationen 
machen konnten, veranschaulichen. Die Autorinnen danken den Schulen, die Unterlagen zur Verfügung stellten. 


2 Auf die Abschlussprüfung/Mittelschule (8. Schulstufe) aus Englisch wird aus organisatorischen Gründen 
nur fallweise hingewiesen. 
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Der Eintritt in einen neuen Schultyp ist für einen jungen Menschen, für seine 
soziale, motivationale, kognitive wie für die Sprachentwicklung immer eine He- 
rausforderung: Neue organisatorische Rahmenbedingungen, Bezugspersonen 
und Kommunikationskulturen drängen sich auf und nötigen der Schülerin/dem 
Schüler einiges an Anpassung und Neupositionierung ab. Damit der Übergang 
von der alten in die neue Schule gut gelingt, ist es wichtig, dass die Leistungs- 
messung am Ende der Abgeberschule — wie wohl sie auch eine punktuelle 
Standortbestimmung ist — in einem fortdauernden individuellen Bildungspro- 
zess eingebettet gesehen wird und bleibt. Die Gestaltung der Überprüfung ist so 
zu organisieren, dass Transparenz gewährleistet ist. Transparenz unterstützt die 
Vergleichbarkeit und das Begründen bei Selektionsentscheidungen — wichtig für 
die Akzeptanz der Lehrerentscheidungen wie der Institution — und kann dazu 
beitragen, interdisziplinäre Vernetzungen im Fachlichen wie Pädagogischen 
sichtbarer zu machen. Darüber hinaus hilft Transparenz der Schülerin/dem 
Schüler ihren/seinen Bildungserfolg mit Distanz zu betrachten, mit Kriterien 
und Bewertungen souverän umzugehen, die Beurteilung innerlich anzunehmen 
und darauf aufbauend neue selbsttätige Schritte für die Zukunft zu setzen. Die 
Berücksichtigung von Transparenz zieht eine innere Koordinierung und Ab- 
stimmung der Bewertungsformen und -inhalte und klare Anleitungen mit sich. 
Zwischen Prüfungsgegenstand, Anforderungen, Bewertungskriterien, Aufga- 
benformaten, d.h. Prüfungsaufgaben oder Themenstellungen, besteht ein Zu- 
sammenhang, dem wir im Folgenden exemplarisch nachgehen wollen. Es geht 
vor allem um eine kritische Beleuchtung der in vorliegenden Dokumenten 
sichtbaren Prüfungskultur und deren innerer Stimmigkeit. Wir fragen danach, 
wie klar, transparent und kohärent in der Aufgabenstellung und in der Bewer- 
tung bei Prüfungen umgegangen wird und inwieweit darin auch sprachenüber- 
greifende und lernerorientierte Bezüge Berücksichtigung finden. Bei allem ist 
zu bedenken, dass die gesetzlichen Vorgaben in Italien bzw. Südtirol seit zwei 
Jahren einer starken Veränderung unterzogen wurden. Die Fort- und die Aus- 
bildung sind sehr gefordert, den neuen Anforderungen gerecht zu werden. 

In einem ersten Abschnitt (siche Kapitel 2) wird mit Überlegungen zur Sprachent- 
wicklung und zum Sprachenlernen im Mittelschulalter der pädagogische und 
sprachdidaktische Rahmen abgesteckt, dem folgt eine Hinwendung zur Ausformung 
der Kompetenzenorientierung an Südtirols Schule und die Sichtbarmachung dersel- 
ben in den gesetzlichen Vorgaben für die Abschlussprüfung. In Kapitel 3 schränken 
wir das Thema: „Überprüfen von Schreibleistungen“ auf wenige Aspekte ein: Wir 
hinterfragen die impliziten Anforderungsprofile an die Kandidaten/innen, die hinter 
(beispielhaft ausgewählten) Themenstellungen stehen, indem wir auch auf die Leh- 
rerkommentare (verbale Begründungen) zu den Schülertexten eingehen. In den 
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Schlussüberlegungen (Kapitel 4) wird nochmals unterstrichen, dass Prüfungskultur 
und Schnittstellendidaktik zusammenhängen und dass qualitative Veränderungen in 
der Herkunftsschule nachhaltig auf die nächste Schulstufe einwirken. 


2. Sprachentwicklung in der Zeit der Mittelschule 

In der Zeit des Übergangs von der Grund- zur Mittelschule, also im Alter von 10 
-11 Jahren lässt sich beim Kind eine Weiterentwicklung des Sprachverhaltens, die 
mit der kognitiven, psychischen und sozialen Reifung einher geht, beobachten. Da 
ist z.B. die starke Orientierung an Bezugspersonen und deren Werten zu nennen, 
die unter kommunikativem Aspekt gesehen sich auch in Imitation (z.B. Gestik, 
Wortwahl, Intonation) abbilden kann. Neugierde und eine große Wissensbehaltfä- 
higkeit korrelieren mit der Lust an Außen- und Weltzuwendung, die den Heran- 
wachsenden voll erfasst. Der (schulische) Wortschatz wächst stark an, die gramma- 
tischen Strukturen werden ausgebaut, die Merkmale einer formalisierteren Sprache, 
welche den Weg zu einer entfalteten Schriftlichkeit ebnet, eingeübt. Im Allgemei- 
nen in der zweiten Hälfte der Mittelschulzeit besonders sichtbar nimmt die Fähig- 
keit zur Ordnung von Begriffen, von Wichtigerem und Unwichtigerem, von Abs- 
traktem und Konkretem zu. Die höhere Abstraktionskompetenz ermöglicht die 
Sondierung von Subjektivem und Allgemeinem und den funktionalen Einsatz von 
Sprache in längeren Textteilen. Die Textkompetenz als ein komplexes Bündel von 
kognitiven, von Sprachbasis- und Sprachhandlungsfähigkeiten wird zu einem zen- 
tralen didaktischen Ziel des Muttersprachunterrichts. Gleichzeitig wächst die 
Fähigkeit, Sprache in der Interaktion gezielt einzusetzen, als Mittel der Identifika- 
tion, z.B. in der eigenen Gruppe oder zur Abgrenzung von der Welt der Erwachse- 
nen. Die Übergangszeit von der Mittel- zur Oberschule, parallel zur Zeit der sog. 
zweiten Adoleszenz, spiegelt sich in verändertem Lese- und nonverbalem Verhal- 
ten wie im Sprachgebrauch wider. Altersspezifische Varietäten sind identitätsstif- 
tend wichtig, Dialogisieren und Argumentieren treten hervor, das Erzählen stag- 
niert. Die Entwicklung der Fähigkeit hin zu einer multiplen, intersubjektiven 
Sichtweise, die die Strategien des Dialogisierens und Argumentierens, die Em- 
pathiefähigkeit und den Besitz eines erweiterten Weltwissens voraussetzt, wird 
prozesshaft erworben, die Aneignung, besonders in der Schriftlichkeit, beginnt in 
der Mittelschulzeit, hält aber über die gesamte Jugendzeit an. Wie im Einzelnen 
die Sprachaneignung geschieht, ist noch nicht vollkommen geklärt, es gilt aber als 
gesichert, dass eine reichhaltige Interaktion, mit emotionalen Implikationen einer- 
seits, im Umgang mit Mustersprachhandlungen (z.B. im Leseangebot) andererseits 
auf den Lernenden stimulierend wirkt. Darüber hinaus wissen wir von der kogniti- 
ven Sprachforschung, dass die Fähigkeiten zum Bilden von Begriffen, das Abstra- 
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hieren, Begründen, Zusammenfassen usw. zwar an Sprachkompetenz gebunden 
sind, sie an sich aber kognitive Fahigkeiten sind, die hinter den Sprachfahigkeiten 
liegen (vgl. Schmélzer-Eibinger 2008: 44-59). 

Das mehrsprachige kommunikative Angebot auch in der Schule spielt beson- 
ders beim Zweitsprachlernen eine essentielle Rolle, um so mehr, wenn im Au- 
ßerschulischen dies nicht selbstverstindlich in dem Maße gegeben ist, wie 
man es in einer zweisprachigen Region wie Südtirol vermuten würde. Der 
Aufbau einer soliden Sprachbasis, zu der vor allem auch ein reicher Wort- 
schatz gehört, ist ein weiteres wichtiges Ziel. Darüber hinaus braucht es auch 
Transfermöglichkeiten von der Mutter- in die Zweitsprache im oben genann- 
ten kognitiv-akademischen Bereich, welche vor allem für das Erlernen der 
Schriftsprachlichkeit in der Zweitsprache grundlegend sind. Die wissenschaft- 
liche Forschung zur (ontogenetischen) Schriftsprachentwicklung der Mutter- 
sprache (Erstsprache) im Mittelschulalter konzentriert sich derzeit besonders 
auf die Erforschung der Aneignung von Schreibstrategien und Textsorten- 
kompetenz (vgl. Augst u.a. 2007). Immer wieder wird betont, dass die Ent- 
wicklung von sprachlichen Fertigkeiten nicht kontinuierlich, sondern in Schü- 
ben und oft gesplittet erfolgt. Dass die Sprachentwicklung darüber hinaus 
auch vom sozialen Kontext (siehe z.B. das Phänomen der Jugendsprache bis 
hin zu den Besonderheiten der Geschlechtszugehörigkeit) mit gesteuert wird, 
ist augenscheinlich. In der Zweit- und Fremdsprachenforschung erhalten 
Untersuchungen zu den Lernerstufen, zu den Auswirkungen bilingualer Mo- 
delle auch auf das Drittsprachlernen und das Sprachverhalten in mehrsprachi- 
gen Situationen derzeit große Aufmerksamkeit (vgl. Ahrenholz u.a. 2008). 
Zusammenfassend lässt sich also sagen: Für die individuelle Sprachkompetenz- 
entwicklung der Erst- wie der Zweitsprache sind der Aufbau allgemeiner kognitiver 
Strukturen, die zum Teil transferiert werden können, der Zugang zu Texten (über 
das Lesen, inklusive Mediennutzung) und die Sprachanwendung im sozial-kommu- 
nikativen Kontext extrem wichtig. Darüber hinaus hängt es ein Stück weit von den 
Neigungen und dem persönlichen Nützen des Lernangebotes ab, welcher individu- 
elle Stil sich bei der Schülerin/ beim Schüler herausbilden wird. So lassen sich auch 
bei jungen SprachteilhaberInnen Tendenzen zu eher affektiv-kommunikativen, zu 
informationsorientierten oder synthetisierenden Schreibhaltungen beobachten. 

Von den schriftsprachlichen Strategien des Erzählens, Beschreibens/Berichtens, 
Instruierens und Argumentierens ist zu Beginn der Mittelschulzeit das Erzäh- 
len am weitesten entwickelt. Erzählen kann mündlich oder schriftlich erfolgen, 
eigene oder fremde Erfahrungen inkludieren, aber ebenso im Zusammenhang 
mit (erzählender) Literatur stehen. Leseerfahrungen — zunehmend auch im me- 
dialen Kontext — wiederzugeben und persönlich zu verarbeiten ist für die Schü- 
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ler/innen motivierend und anregend. Die Strategien des Erzählens, Beschrei- 
bens und Berichtens kommen auch in der Zweitsprache zum Tragen und sind 
im schriftsprachlichen Kontext weitgehend übertragbar. 

Bezeichnend für das Mittelschulalter ist auch die sog. materialsystematische Pha- 
se (vgl. Augst/Faigel 1986: 116), in der Schüler/innen das reiche Wissensangebot 
der Sachfächer sowie die zur Verfügung stehenden häuslichen Medien nutzen 
und in ihre Texte einzubauen lernen. Auch diese Fähigkeit kann sprachübergrei- 
fend geschärft werden. Mit Hilfe von gezielten Such-, Lese- und Umformungs- 
strategien lernen die SchülerInnen im Laufe der Mittelschuljahre ihre Begriffs- 
verwendungen zu schärfen. Das Definieren und der sichere Umgang mit 
Begriffen, Themenwörtern und Wortverbindungen sind eine Grundvorausset- 
zung für den anspruchsvolleren Umgang mit Sachtexten, in der Argumentation, 
in der gestalteten Rede wie in schriftlichen Texten. Interessant ist, dass die Schü- 
lerInnen sehr wohl ein Gespür dafür zeigen, dass und wie sie mit formalen As- 
pekten im Bereich der Textkompetenz, z.B. Vorgaben für Textsorten, umgehen 
sollen. Auch das Gespür dafür, sich in adressatenbezogenen Texten auf das Ge- 
genüber einzustellen, ist ohne Zweifel präsent, insgesamt handelt es sich aber um 
einen Prozess, der erst im jungen Erwachsenenalter als abgeschlossen gelten kann. 
Auch die eigene Meinung ist in dem genannten Lebensalter schon zu vielem glo- 
bal vorhanden, die Fähigkeit zur Differenzierung ist aber noch beschränkt, da der 
Zugang zu kontroversen Lebensentwürfen meist fehlt und persönliche Erfahrun- 
gen in der Regel noch wenig routiniert aufeinander bezogen werden können. In 
der Mittelschulzeit dieses zu verlangen führte unweigerlich zur Wiedergabe von 
Plattitüden und Klischees. In jedem Fall hilfreich ist, wenn Themen auf der 
Grundlage vorliegender Textquellen schriftlich diskutiert werden können. 
Die Fähigkeit inhaltlich kontroversielle Positionen darzulegen und dazu persön- 
lich Stellung zu beziehen, nimmt — nach dem Schulwechsel — in den ersten Ober- 
schuljahren sprunghaft zu, vorausgesetzt, dass die Schülerin/der Schüler kontinu- 
ierlich und in didaktischen aufbereiteten Lerneinheiten dazu angehalten wird. 


3. Überprüfung der Schreibkompetenzen am Ende 

der Mittelschule 

Am Übergang Mittelschule-Oberschule sind Jugendliche beim Schreiben in 
der Muttersprache in der Regel fähig 


e zu persönlicher Verarbeitung von Gelesenem; 

. zum Extrapolieren und Gewichten von Informationen aus vorliegenden Texten; 
° zum Befolgen von Sprachnormen bei mittlerer sprachlicher Komplexität; 
. zum produktiven Umgang mit ausgewahlten Textsorten. 
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In Entwicklung befinden sich auch die Kompetenzen 


. mit Sprache und Sprachstrategien in einer persönlichen (intersubjekti- 
vem) Form umzugehen; 

° die eigenen Texte zu überarbeiten und darüber zu reflektieren; 

s erworbene Kompetenzen aus einer Sprache in eine andere zu übertragen 
(Sprachvergleiche); 

. Themen argumentativ zu bearbeiten und dazu eigene Haltungen zu for- 
mulieren. 


Solche Befähigungen sind als erreichte Kompetenzniveaus/Muttersprache am 
Ende der Mittelschule auch in den Rahmenrichtlinien — mit einer besonderen 
Betonung der mündlichen Kompetenzen - festgehalten (vgl. Rahmenrichtli- 
nien 2009). Die Befähigungen zum kompetenten Umgang mit Sprache sind 
nicht nur reproduzierend oder auf Wissenszuwachs ausgerichtet, sondern sie 
sind auch prozessualer und methodischer Art bzw. sie tangieren Werthaltun- 
gen. Neben der Aneignung von Welt- und Fachwissen ist die Förderung von 
Haltungen und Fertigkeiten von zentraler Bedeutung. Daraus ergibt sich, dass 
die Einschätzung des persönlichen Bildungsweges bei Prüfungen ebenso eine 
Rolle spielt. Standardisierung und Vergleichbarkeit einerseits, langfristig ange- 
legte individuelle Förderung andererseits in Balance zu halten, verlangt den 
Lehrpersonen viel ab. Nur wenn dies garantiert wird, kann die Fähigkeit zur 
Selbststeuerung der Lernenden nachhaltig unterstützt werden. Auf Letzteres 
legen auch die Rahmenrichtlinien Wert: 


„Die Unterrichtstätigkeiten haben die Entwicklung von Lernbewusstheit und Lernkompetenz im 
Blick, Schülerinnen und Schüler entwickeln die Fähigkeit, die Verantwortung für den Lernpro- 
zess selbst zu übernehmen, selbstreflexiv eigene Kommunikations- und Lernstrategien auszubil- 


den und weiter zu entwickeln“ (vgl. Rahmenrichtlinien 2009: 20). 


Der Gesetzgeber steckt den Rahmen ab, innerhalb dessen die sprachliche Ent- 

wicklung am Abschluss der Mittelschule zu überprüfen und das Leistungspo- 

tential dokumentiert werden soll. Es gibt diesbezüglich eine Reihe von wich- 

tigen Dokumenten. 

Solche sind z.B.: 

e Richtlinien und Verfahren für die Abschlussprüfung über die Mittel- 
schule (Anlage C zu: Lehrpläne, Stundentafeln und Prüfungsordnung 
für die Mittelschule in der Provinz Bozen aus dem Jahre 1983); 

° Rahmenrichtlinien des Landes für die Unterstufe (2009); 
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. Rundschreiben vom 14.3.2008, Nr. 32 des italienischen Unterrichtsmi- 
nisteriums (betrifft: Bewertung in der Unterstufe, Abschlussprüfung 
Mittelschule). 

Eine reibungslose Umsetzung der rechtlichen Vorgaben im schulischen Rah- 

men wird durch den Umstand erschwert, dass noch nicht alle rechtlichen Do- 

kumente aufeinander abgestimmt sind. Zwischen der Entstehung der ver- 
schiedenen Dokumente gibt es große zeitliche Abstände und dies führt 
notgedrungen zu Unterschieden in den Konzepten. Dies gilt im Besonderen 
für die Prüfungsverordnung (1983!), die mit den jüngeren Rahmenrichtlinien 

2009 nicht akkordiert ist. Auch haben die sprachlichen Niveaustufen des Ge- 

meinsamen Europäischen Referenzrahmens für Sprachen (vgl. Europarat 

2001) zwar in das Europäische Sprachenportfolio (ESP) (vgl. ESP 2006), wel- 

ches aber nur empfehlenden Charakter hat, Eingang gefunden, noch nicht 

aber in die Prüfungsverordnung. Auch die zusätzliche gesamtstaatliche Prü- 
fung aus Deutsch/schriftlich zu den Lernbereichen Textverständnis und Ein- 
sicht in Sprache/Grammatik, im Schuljahr 2007/08 zum ersten Mal einge- 
führt (vgl. Gesetz Nr. 176/2007), ist nicht wirklich mit den übrigen 

Prüfungsteilen abgestimmt. Ebensolches gilt auch für die Vorgaben zur For- 

mulierung der Aufgabenformate (Themenstellungen) wie für die innere Ko- 

ordinierung (Ziele, Inhalte) zwischen den Sprachfächern. 


3.1. Anforderungen der schriftlichen Prüfungen (Mittelschule): 
Deutsch (Muttersprache), Italienisch (Zweitsprache) 

Eine entscheidende Rolle spielt bei den schriftlichen Prüfungen eine sehr gute 
Themen- bzw. Aufgabenstellung. Bei der Formulierung der Aufgabenstellun- 
gen sind im Fach Deutsch bzw. Italienisch/L2 laut Prüfungsvorgaben 1983 fol- 
gende allgemeine Angaben zu berücksichtigen: 


Vorgaben aus der Prüfungsverordnung für die Formulierung der Themen in 
schriftlichen Prüfungen 


Fach: Deutsch/Muttersprache Fach: Italienisch/L2 
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V1. Darlegung, in der der Schiiler V1. Darlegung von persönlichen Er- 
seine wirklichen Erfahrungen oder fahrungen oder von Vorstellungen aus 
Vorstellungen aus der Phantasie (in der Phantasie in Form einer Bericht- 
Form einer Berichterstattung, eines erstattung, eines Tagebuches, eines 
Tagebuches, eines Briefes, einer Er- Briefes, einer Erzählung usw.; 
zahlung usw.) ausdriicken kann; 
V2. Behandlung eines Themas von V2. Bericht tiber ein Thema, das 
allgemeinbildendem oder sozialem in der Zweitsprache oder auch in 
Charakter, das die Darlegung persön- Zusammenhang mit anderen Fach- 
licher Gedanken ermöglicht; bereichen behandelt wurde; 
V3. Arbeit über ein Thema aus irgen- V3. Nachgestaltung eines gelesenen 
deinem Fachbereich. Textes mit persönlichen Überlegun- 
gen zum Inhalt. 
Tab. 1 entnommen aus: Lehrpläne, Stundentafeln und Prüfungsordnung für die Mittelschule in 


der Provinz Bozen. (1983) 


Die Gegenüberstellung in Tabelle 1 zeigt, dass für die expressiv-erzählende 
Themenstellung in beiden Sprachen die selben Textsorten in Betracht gezogen 
werden, z.B. Tagebuch, Brief, Erzählung (siehe D_V1, I_V1). In den Themen- 
stellungen V2 und V3 werden nicht Textsorten, sondern nur Schreibhaltungen 
genannt: „darlegen“ (D_V2), „berichten“ (I_V2) oder die Textsorte bleibt offen, 
z.B. „Arbeit über...“ (D_V3). In beiden Fächern ist ein fachübergreifendes 
Thema verpflichtend vorgesehen (siehe D_V3 und I_V2). Der wesentliche 
qualitative Unterschied die Textsorte und die Sprachstrategien betreffend be- 
steht zwischen der Themenstellung D_V2 und I_V3: In der deutschen Prüfung 
wird ein Thema allgemeinbildender oder sozialer Art vorgegeben, zu dem die 
Schülerin/der Schüler „persönliche Gedanken“ darlegen soll, was einer Vorstufe 
des Argumentierens gleichkommt. „Persönliche Überlegungen“ werden auch in 
Italienisch erwartet, allerdings in engem Zusammenhang mit einem gelesenen 
Text. In I_V3 steht die Nachgestaltung eines gelesenen Textes im Mittelpunkt, 
was bedeutet, dass mit der schriftlichen Arbeit auch die Lesekompetenz kon- 
trolliert wird. Letzteres wird in der Muttersprache seit dem Schuljahr 2007/08 
in der zusätzlichen gesamtstaatlichen Prüfung eingefordert (vgl. Gesetz vom 
25.10.2007, Nr. 176). Damit wird umgesetzt, was in neueren schreibdidakti- 
schen Konzepten auch für die Muttersprache angemahnt wird, nämlich, die 
Bedeutung des Lesens für den Schreibakt selbst aufzuwerten. Um den Lese- 
und Schreibprozess zu portionieren und die Leistungen der Schreibenden bes- 
ser ergründen zu können, wird zunehmend auch in muttersprachlichen Prü- 
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fungsvorgaben höherer Schulstufen von Textvorlagen, die lesend bearbeitet 
werden müssen, ausgegangen.” 


Der Gesetzgeber gibt zwar Textsorten/Schreibhaltungen für die schriftlichen 
Prüfungen vor, belässt es aber den Prüfungskommissionen* die Aufgabenstel- 
lungen zusammen zu stellen. Es gibt für die FachlehrerInnen bzw. die Kom- 
mission keine Hinweise zur formalen Konstruktion der Themenstellungen 
bzw. zur Formulierung eines erwünschten Erwartungshorizontes. Der knappe 
Verweis auf Kriterien für die Beurteilung? verrät nichts über Gewichtungen 
derselben oder über einen eventuellen Bezug zu Niveaustufen in der Bewer- 
tung. Eine innere Koordinierung der Ansprüche an die muttersprachliche und 
zweitsprachliche SchülerInnenleistung wird zwar in Hinweisen zu gemeinsa- 
men Aspekten (z.B. die Betonung von Textsorten/Schreibhaltungen; Verweis 
auf lebensweltliche Anbindung) oder aber durch koordinierte Abstufungen 
(z.B. Tiefe der Verarbeitung eines Sachthemas: „Arbeit über...“(D3) versus 
„Bericht tiber...“(I 2)) sichtbar. Ein Korrekturschlüssel oder feinjustierte Kri- 
terienkataloge, die z.B. auf bestimmte Textsorten Rücksicht nehmen und 
ebenso Ausdruck einer gemeinsamen Prüfungskultur sind, fehlen hingegen. 
Die Korrektur und die Bewertung nehmen die FachlehrerInnen in Unterkom- 
missionen bzw. nimmt die gesamte Prüfungskommission vor. Sie beziehen sich 
dabei auf einen intern beschlossenen Kriterienraster, der sich mit den Krite- 
rien in der curricularen Planung der Schule deckt. An eine externe Zweitkor- 
rektur o.Ä. ist nicht gedacht. 


3.2. Beispiele zu Themenstellungen aus der Prüfungspraxis 
Einige Beispiele zu Prüfungsthemen aus dem Schuljahr 2006/07 einer zufällig 
ausgewählten Klasse sollen zeigen, wie die (unterschiedlichen) Anforderungen 


3 Vergleiche z.B. die verpflichtenden Textvorlagen in Themenstellung A, B bei der zentralen italienischen 
staatlichen Abschlussprüfung der Sekundarstufe II, Fach Muttersprache (vgl. Ministerialdekret vom 
23.04.2003, Nr. 41) wie auch in der beschlossenen Reform der österreichischen Reifeprüfung aus Deutsch/ 
AHS. www.bifie.at (Stand: 25.10.10) 


4 Die Prüfungspräsidentin/der Prüfungspräsident wird von außen berufen, die weiteren Mitglieder der Kom- 
mission sind Lehrer/innen der Klasse. 


5 Siehe dazu die einschlägigen gesetzlichen Textstellen zu Deutsch/Muttersprache: „Die schriftliche Arbeit 
hat zu überprüfen, ob das Thema inneren Zusammenhang und logische Gedankenfolge aufweist und ob der 
Schüler über persönlichen Ausdruck und normgerechten und angemessenen Sprachgebrauch verfügt.“ Be- 
züglich Italienisch/L2 heißt es: „Die schriftliche Arbeit hat den normgerechten und angemessenen Sprach- 
gebrauch des Schülers zu überprüfen, ebenso die Fähigkeit, ob er eigene Gedanken klar ausdrücken kann.“ 
(vgl. Lehrplan (1983), Auszug aus den Prüfungskriterien) 


187 


188 


Annemarie Saxalber, Rita Gelmi 


an die schriftlichen Mittelschulprifungen in Deutsch und in Italienisch/L2 


umgesetzt werden.® 


Deutsch/Muttersprache 


Italienisch/L2 


Beispiel: Themenstellungen einer Priifungskommission 


m 


In Gedanken achtete ich viel 
zu wenig auf das, was um mich 
herum passierte... (11x)? 


Was sind aus deiner Sicht sin- 
nvolle Formen der Freizeit- 
beschäftigung? Führe einige 
an und erläutere sie möglichst 


anschaulich! (4x) 


Die Industrielle Revolution 
hat unsere Welt entscheidend 
verändert. Lege dein Wissen 
darüber möglichst anschaulich 
dar! (2x) 


Sei in soffitta e trovi un vec- 
chio baule. Senti dei rumori 
all’interno. Con un po‘ di paura 
lo apri e...Racconta! (4x) 


Scrivi una lettera a un'amica e 
racconta di una gita scolastica 
che ti è piaciuta particolar- 
mente. Descrivi i luoghi che 
hai visitato, le persone che hai 
incontrato e scrivi che cosa ti è 
piaciuto e perché! (4x) 


Scrivi di un personaggio in ital- 
iano, che ti ha particolarmente 


colpito! (9x) 


(mit Textvorlage 
Füge das korre o. Subjekt, Ob- 


jekt und possessiv Pronomen 


ein. 
Bilde die Mehrzahl der Na- 


men, die in der Klammer sind. 


Setze die Verben im present 
simple ein. 

Setze den richtigen Kompara- 
tiv und Superlativ ein. 

Bilde Sätze in der Negativform 
und Fragesätze. 

Setze das richtige Fragewort ein. 
Wähle die richtige Präposition, 
um den Satz zu en 
digen. 

Eine Geistergeschichte. 

Setze die Verben in Klammer 
im past simple ein und vervoll- 
ständige den Text. 

Bilde korele Sätze (Satzele- 
mente sind vorgegeben). 

Setze die koreke Zeit ein: 
present simple, present progres- 
sive, past simple, gn 1g to ia 
and will future. Achte auf 
bestimmte Worter, die dir die 
Wahl erleichtern. 

Bilde korrekte Satze mit den 
Adverbien in den Bildern. 
Schreibe eine kurze Geschichte 
mit den Wortern im Box (10 
Sitze). 


Tab. 2 


Die Aufgabenformate in den beiden Sprachfichern Deutsch und Italienisch 
sind in sich unterschiedlich: einige sind zweigeteilt und enthalten im zweiten 
Teil explizite oder implizite Hinweise zur Textsorte oder zu den Schreibhal- 


6 Ergänzend wird in Tabelle 2 auch die dreigeteilte Aufgabenstellung aus Englisch/L3 derselben Klasse ange- 
führt. In dem vorliegenden Fall wurde in Englisch von allen SchülerInnen dieselbe Aufgabenstellung aus- 
geführt. Die Prüfungsverordnung sieht vor, dass jede Aufgabenstellung in Englisch/L3 sich in verschiedene 
Teilaufgaben gliedert, die auf die Kompetenzbereiche: a) Textverständnis, b) Wortschatz, c) Länderkundli- 
ches Wissen eingehen müssen (siehe dazu Prüfungskriterien, Lehrplan (1983). 

8 Die Zahlen in Klammern drücken aus, wie oft ein Thema von den SchülerInnen der betroffenen Klasse 
gewählt wurde. 
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tungen (z.B. D 2, I 2). Andere Themen sind so formuliert, das der Schülerin/ 
dem Schüler Schritte zur inhaltlichen Abfolge nahe gelegt werden (siehe 11). 
Besonders das Thema D_1 ist aber so offen formuliert, dass für die SchülerIn- 
nen Missverständnisse provoziert werden. 

Es ist für den Leser nicht von vorne herein klar, ob es sich bei der Themen- 
stellung D 1 um einen Textanfang oder um einen Kern- oder Lehrsatz einer 
zu gestaltenden Geschichte handelt. Da jede pädagogisch/didaktische Hilfe- 
stellung zu Textsorte/Schreibhaltung fehlt, führte die Angabe in den Schüler- 
texten zu unterschiedlichsten Umsetzungen, von denen kaum eine von der 
korrigierenden Lehrperson goutiert wurde. Hinter der Themenstellung stand 
— den Korrekturen nach zu schließen — die Erwartungshaltung, dass der Satz 
der Themenstellung inhaltlich und formal Auslöser des Höhepunktes der Er- 
zählung sein, der entsprechend ausgestaltet werden sollte. Dass der „gedanken- 
verlorene“ Ich-Erzähler gleichzeitig Hauptakteur/in sein sollte, erforderte ei- 
nen Spannungsbogen, den die meisten Schüler/innen nicht schafften.’ 


Die Schüler/innen wählten die zur Wahl stehenden Themenstellungen aus 
Deutsch unterschiedlich oft: Am häufigsten wurde auf die erste Themenstel- 
lung zugegriffen, wohl auch deshalb, weil die beiden sich implizit anbietenden 
Textsorten: Erzählung, Phantasiegeschichte seit langem und schulstufenüber- 
greifend eingeübt werden konnten. Auffallend selten wurde das Thema D 3 
gewählt, auch wenn der Inhalt fester Bestandteil im Geschichteunterricht ei- 
ner 8. Schulstufe ist. Der inhaltliche Aspekt der Themenstellung im ersten 
Teil ist weit und undifferenziert, wogegen die Anleitung im zweiten Teil 
(„Lege dein Wissen drüber möglichst anschaulich dar.“) der Schreibenden/ 
dem Schreibenden a) viel (Spezial) Wissen und b) die Darlegung in einer 
möglichst „anschaulichen“ Sprache und Textform abverlangt. Diese Kombina- 
tion an Ansprüchen — hier Informationsdichte, dort „Anschaulichkeit“ — stellt 
als Basiskompetenz, die von allen SchülerInnen bewältigt werden soll, eine 
Überforderung dar. 


9 Einige Beispiele: 
S1 endet mit einem persönlichen Vorsatz: „Dieser Vorfall war mir eine Lehre und ich werde nun besser 
aufpassen, was um mich herum passiert.“ 
S 2 erzählt eine Geschichte, in dem ihm/ihr vor lauter Unachtsamkeit beinahe ein schwerer Skiunfall pas- 
siert wäre. Er/sie verpackt die inhaltliche Aussage der Themenstellung in die erfolglosen Anweisungen des 
Vaters: „Immer wieder schrie der Vater mir zu, dass ich mehr aufpassen sollte aber ich tat es nicht.“ 
S3 berichtet von einem Tag, an dem ihm/ihr zumindest dreimal — weil gedankenverloren- Ungeschicklich- 
keiten passierten, was zu zumindest drei „Höhepunkten“ in der Geschichte führte. Der Text endet schließ- 
lich mit dem Satz: „Doch dieses ganze Theater alles nur, weil ich mit dem Kopf in den Wolken bin, und so 
ein Tag ist darum bei mir keine Seltenheit.“ 
S 6 kommentiert mitten im Text das Verhalten der Hauptfigur Alex: „Doch Alex konnte heute einfach nicht 
mitlachen, denn er war mit den Gedanken nicht bei Peter und Franz, sondern bei Jasmin.“, was die korrigie- 
rende Lehrperson kommentierte mit: „Der Höhepunkt kommt nicht gebührend zur Geltung“. 
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In der Zweitsprache hingegen ist das fachbezogene Thema das am häufigsten 
gewählte (9/17), da es sich auf ein begrenztes schulisches Wissen bezieht, wel- 
ches im Fach selbst behandelt worden ist. Dass das Thema eigentlich nicht 
der gesetzlichen Vorgabe (siehe I_V 3) entspricht, welche die „Nachgestal- 
tung“ eines Textes nahelegt, muss hier für die Schüler/innen kein Nachteil ge- 
wesen sein. 

Die Themenstellungen sind unterschiedlich formuliert und was die Erwar- 
tungshaltung anbelangt nicht immer eindeutig genug — weder für die Schüler/ 
innen noch für die mitkorrigierenden Lehrpersonen. Aufgabenformate, in de- 
nen die Wiedergabe und Verarbeitung von geordnetem Sachwissen im Vor- 
dergrund steht und mit denen erst in den Mittelschuljahren umgegangen wird, 
bedürfen vielfältiger Übungssituationen im vorangegangenen Unterricht. Nur 
nach wiederholtem Üben in stressfreien Situationen wagen sich die Schüler/ 
innen in Prüfungssituationen in der Regel an solche Themen heran. 


3.3. Verbale Beurteilungen von Schülerleistungen: 

Deutsch (Muttersprache), Italienisch/L2 - Beispiele 

Die Prüfungsarbeiten werden von einer Unterkommission korrigiert, was in 
der Praxis aber nicht immer bedeutet, dass die Lehrer/innen dabei gleichzeitig 
über ein und demselben Text sitzen. Die Bewertung des den Autorinnen vor- 
liegenden Prüfungsmaterials, das aus dem Schuljahr 2006/07 stammt, erfolgte 
mittels einer verbalen Beurteilung, die dann von der Prüfungskommission be- 
schlossen wurde. 

Verbale Beurteilungen sind sprachlich ausgeführte Bewertungen, die eine Zif- 
fernnote oder eine Punktezahl ersetzen. Verbale Beurteilungen können aber 
auch als Ergänzung zu den zu vergebenden Punkten oder Ziffernnoten auftre- 
ten, wie in der Abschlussprüfung der Oberschule schon seit der gesamtstaat- 
lichen italienischen Reform 1998/99 oder in der Mittelschule seit der Re- 
form 2007/08 gegeben (vgl. Rundschreiben 14.3.2008, Nr. 32). 

Die verbale Bewertung erfüllt wie die Ziffernote eine „bewertend-prüfende“ 
Funktion. Sie kann aber so angelegt werden, dass sie zusätzlich „fördernd“ 
wirkt und der Schreibenden/dem Schreibenden signalisiert, welche Aspekte 
ihrer/seiner Schreibkompetenz wie weiterentwickelt werden sollen. Die „för- 
dernde“ Funktion greift individuell angelegte Aspekte der Schreibentwicklung 
auf und vermeidet eine zu starke Defizitorientierung. Die Lehrperson em- 
pfiehlt sich gleichsam als Berater/in für Schreibentwicklung und verweist auf 
den erfolgreichen Einsatz von Strategien, eventuell auch aus der Optik einer 
gemeinsamen Sprachenerziehung. Diese fördernde Haltung muss bei der Ab- 
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schlussprüfung nicht ausgeschaltet werden, zumal ja Ziel der Prüfung selbst 
auch ist, die erreichten Kompetenzen dezidiert zu benennen (vgl. Landesge- 
setz v. 16.7.2008, Nr.5, Anlage, Ar.16, Abs.5). Solche Kompetenzbeschreibun- 
gen können der Kandidatin/dem Kandidaten bei der Entscheidung über den 
weiteren Bildungsweg helfen, jedenfalls wird in den Rahmenrichtlinien Kom- 
petenz in diesem Sinne verstanden: 


„Laut Empfehlung des Europäischen Parlaments und des Europäischen Rates vom 7. September 
2006 wird Kompetenz definiert als nachgewiesene Fähigkeit, Kenntnisse, Fertigkeiten sowie per- 
sönliche, soziale und/oder methodische Fähigkeiten in Arbeits- und Lernsituationen und für die 


berufliche und/oder persönliche Entwicklung zu nutzen.“ (Rahmenrichtlinien 2009: 18) 


Die folgenden Beispiele zeigen uns, welche verbalen Beurteilungen die Schü- 
lerInnen S 1, S 2, S 9 bzw. S 10 erhalten haben. 


Verbale Beurteilungen aus Prüfungsbeispielen 
Deutsch/Muttersprache Italienisch/L2 
Bsp.: (S1/Ihema: 1) Es.: (S1/tema nr. 1) 
Sprachlich ist die Arbeit bis auf zwei Ha rispettato la traccia. Il contenuto & 
Stellen klar und angemessen. Der Aufbau |sufficiente, la forma abbastanza scor- 
ist gut und steigert sich einem Höhep- revole. Il lessico è approssimativo. Errori 
unkt entgegen, der dann nicht ganz dem |nell’uso dei tempi verbali e nell'uso delle 
Thema entspricht. preposizioni. 
Bsp.: (S9/Thema: 2) Es.: (S2/tema nr. 2) 
Thema erfasst und griindlich ausgear- Ha rispettato la traccia. Il contenuto è 
beitet, klare, nachvollziehbare Gedan- sufficiente, la forma abbastanza scorrevole. 
kengänge, sicherer Ausdruck, sichere Lesposizione è comprensibile e il lessico 
Beherrschung der Sprachnormen, einige |abbastanza appropriato. Errori nell’uso dei 
Generalisierungen. tempi verbali, preposizioni e nomi plurali. 
Bsp.: (S10/Thema: 3) Es.: (S9/tema nr. 3) 
Das Thema ist sehr weitläufig und er- Ha rispettato la traccia. Il contenuto è 
schöpfend behandelt. Auch Persönliches | buono, la forma scorrevole. L'esposizione è 
findet sich im Inhalt. Sprachlich sind chiara, il lessico ricco e appropriato. Molte 
einige Stellen etwas ungeschickt aus- le informazioni su Schindler e Anna 
geführt. Der Aufbau klar und folgerichtig. | Frank. Qualche errori di grammatica: uso 
tempi verbali e preposizioni. 


Tab. 3 (Legende: Schüler/in = S; die Nummer des Themas bezieht sich auf Themenstellung D 
1, D 2, D 3 oder | 1,1 2,13, siehe Tabelle 2) 
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Die unpersönliche Art der verbalen Bewertungen (Deutsch wie Italienisch)" 
unterstreicht die betont legitimierende und Output orientierte Absicht der 
Formulierungen. Die Formulierungen bilden eine Zäsur am Ende der Schul- 
stufe ab. Dabei ist die Sprache formelhaft, es werden immer wieder dieselben 
bewertenden Ausdrücke verwendet: z.B. „klar“, „angemessen“, „sicher“; „chia- 
ro“, „scorrevole“, „appropriato“. Diese deuten auf eine implizit vorhandene Ab- 
stufung von Niveaustufen hin (z.B. der „Aufbau“ ist. „klar“/“logisch“ versus 
„verworren“/“wenig durchdacht“). Sicher zu kurz bzw. zu undifferenziert sind 
wertende Ausdrücke dieser Art aber, wenn sie über alle Textfunktionen sum- 
mativ darüber gelegt werden, z.B. auch über Teile, in denen persönliche Ge- 
staltung und Meinung gefordert sind. Der Aufbau der verbalen Beurteilung 
folgt in Deutsch meist der „klassischen Dreiteilung“: Inhalt/Bezug auf The- 
menstellung — Aufbau — Sprache, in Italienisch einer etwas differenzierteren, 
aber stark sprachnormorientierten Unterteilung: traccia, contenuto, forma, es- 
posizione, lessico, grammatica. Die Gewichtung der verschiedenen impliziten 
Kriterien ist nicht nachvollziehbar, es sei denn die Unterteilung von Sprach- 
normverstößen wird als Indiz für „besonders wichtig“ genommen. Auffällig 
ist auch, dass die Beschreibung der inhaltlichen Gestaltung und Vertiefung 
sehr unterschiedlich angegangen wird. Meist bleibt es bei der Einschätzung, 
ob die vorgegebene Themenstellung erfasst wurde: Beispiele: „Ha rispettato la 
traccia“ oder „Themenstellung nicht berücksichtigt“. 

Bei den verbalen Beurteilungen sind verschiedene Korrektoren federführend, 
die, obwohl in einer Unterkommission zur Zusammenarbeit verpflichtet, nicht 
immer mit denselben Differenzierungen vorgehen. 

So wie schon in den Themenstellungen sind auch in den Lehrerkommentaren 
eindeutige Aussagen zur Umsetzung der Textsorte, zu Adressatengemäßheit, 
persönlichem Stil selten, dies gilt z.B. für die Textsorte Brief in I_2 wie für die 
Erzählung in I_1. Demgegenüber wird das Textsortenmerkmal „Hinführen 
zum Höhepunkt“ in einer Erzählung — wie bereits weiter oben erwähnt - in 
den Schülertexten zu D 1 vehement eingefordert. Bei 10 von 11 Lehrerbeur- 
teilungen zum Thema D 1 wird vermerkt, dass der Höhepunkt der Erzählung 
nicht angemessen getroffen worden sei. 

Die korrigierenden Lehrer/innen legen den Arbeiten zwar Kriterien zugrunde, 
da diese in sich aber nicht differenziert sind, kommt es in den verbalen Be- 
gründungen zu schematisierten Einschätzungen; differenzierte Vermerke wer- 
den manchmal, aber nicht durchgehend gemacht. Beobachtungen zur Sprach- 
basis überwiegen gegenüber Beobachtungen zu kognitiven Leistungen. Die 


10 In dem vorliegenden Fall standen uns die verbalen Beurteilungen der FachlehrerInnen, aber leider nicht die 
Kriterien zur Verfügung, wenngleich sie sicher erstellt worden sind. Dieser Umstand erschwert die Einschät- 
zung der verbalen Beurteilungen (Lehrerkommentare) durch die Autorinnen. 


Zur Überprüfung von Schreibleistungen an Schulübergängen 


Würdigung der kognitiven Leistungen ist für die Schreibentwicklung über die 
Schulstufe hinaus aber schr wichtig. 


4. Prüfungskultur und Schnittstellendidaktik 

Abschlussprüfungen sind ein Anlass, an dem nicht nur Einzelleistungen ge- 
messen werden, sondern die Ganzheitlichkeit der erworbenen Bildung auf 
dem Priifstand steht. Der Grundstein ftir die komplexe Vernetzung der Fahig- 
keiten im Kopf der Schülerin/des Schülers wird in einer Lehr- und Lernhal- 
tung angelegt, die der Anbindung von Wissen und Erfahrungen, dem Transfer 
von Fähigkeiten und der Stärkung kognitiver Kompetenzen Raum und Zeit 
gibt. Transparenz und innere Koordinierung der Bildungsziele, -inhalte und 
-anforderungen sind konstitutive Voraussetzungen bei Prüfungen, unabhängig 
davon, ob diese mehr „individualorientiert“ oder „feststellungsorientiert“ sind, 
ja, sie sind notwendig, damit Fördern und Prüfen nicht als Gegensatz erlebt 
werden. Nahtstellen wie der Übergang von einer Schulstelle zur nächsten ha- 
ben etwas Abschließendes wie etwas Vorausblickendes an sich. In diesem 
Spannungsfeld kann sich Nachhaltigkeit entwickeln. 

Die LehrerInnen der Schule, die uns ihre Unterlagen zur Verfügung gestellt 
haben, zeigen großes Bemühen, den Prüfungsvorgaben gerecht zu werden. 
Durch eine ausgewogene Differenzierung in den Kriterien (Niveaustufendif- 
ferenzierung), einer stärkeren Beachtung der kognitiven Kompetenzen und 
der Abstimmung derselben auch zwischen den Sprachfächern könnte ein 
nächster Qualitätsschritt erreicht werden. Der Weg dahin, dass die Schüler- 
texte aus Deutsch und Italienisch derselben Schüler/innen als eine kognitive 
Leistung in zwei Sprachen gesehen werden, wäre dann nicht mehr weit. 

Eine Reihe von Südtiroler Schulen haben in den letzten beiden Jahren ihre 
Kriterien weiterentwickelt. Es gibt vielfältige Beispiele, in denen das Bemühen 
um eine individualisierende Kompetenzenorientierung und um eine disziplin- 
übergreifende Zielgebung in den Sprachfächern inzwischen gut sichtbar ist." 


Einer neuen Prüfungskultur geht die Weiterentwicklung des didaktischen Ver- 

haltens im alltäglichen Unterricht voraus. Dieses baut auf an Ganzheitlichkeit 

und Interdisziplinarität ausgerichteten Grundsätzen von Sprachbildung auf: 

e Der Umgang mit Niveaustufen bei den Kriterien auch zu muttersprach- 
lichen Leistungen erleichtert den professionellen Austausch unter den 
Muttersprach-, Zweit- und Fremdsprachenlehrer/innen. 


11 Als Beispiele seien die Kriterien der Schulsprengel Naturns und Brixen-Milland genannt. 
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° Die Stärkung einer lernerorientierten beratungs- und kriterienorientier- 
ten Prüfungskultur fördert gleichzeitig die Befähigung zu fachlicher 
Selbsteinschätzung und zu einem autonomen wie kooperativen Arbeiten 
der Schülerin/des Schülers. 

. Verbale Schülerbeurteilungen, die auf eine Dialogsituation hin formu- 
liert werden und den Aspekt der Rückmeldung antizipieren, tragen zur 
Nachhaltigkeit pädagogischen Handelns bei. 


Abschlussprüfungen geben mehr von sich preis, als vordergründig angenom- 
men: Abschlüsse dokumentieren nicht nur die erreichten Leistungen der 
Schüler/innen wieder, sie geben vielmehr auch Auskunft, wie die Schule sich 
im Bildungsweg der Jugendlichen positioniert und wie der Übergang auf die 
nächste Schulstufe vorbereitet wird. Es ist den Herkunftsschulen zu wünschen, 
dass der Einsatz ihrer Lehrpersonen in der Nachfolgeschule erkannt wird und 
nicht jede Bildungsstufe von sich behauptet, das „Rad neu erfinden zu müs- 
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Die Vermittlung von Wissen steht heute vor einer zweifachen 
Herausforderung: dem Anspruch auf Verständlichkeit trotz 
hoher Komplexität der Inhalte und dem Erreichen akzeptabler 
Ergebnisse in der Schule in Situationen von immer größerer 
Diversität. Daraus ergeben sich für die Sprachwissenschaft 
neue Schwerpunkte: eine konstante Besinnung auf die 
Phänomene, das sind die kommunikativen Akte von Mitglie- 
dern einer Sprachgemeinschaft im Alltag und in Bereichen 
fachlicher Spezialisierung, das sind aber auch variable 
Kontexte der Sprechakte, die eine Koorientierung der sozialen 
Akteure verlangen, die ebenso gelernt und geübt werden 
muss, wie die Sprachen in ihren formalen und strukturellen 
Eigenheiten. 

In diesem Band werden Forschungen und theoretische 
Ansätze vorgelegt, die ausgehend von diesen Prämissen 
Korpusrecherchen für die Erforschung und für die didaktische 
Vermittlung der drei Schulsprachen Deutsch, Italienisch und 
Englisch nutzbar machen. Besondere Schwerpunkte sind 
Varietäten der deutschen Sprache in Südtirol und die 
Interface-Problematik. 


